見出し画像

ChatGPTへの入力を10倍ラクにする!音声入力3つを比較しました。

こんにちは。プロンプトを有効活用していますか?

ChatGPTに長文を入力する際、タイピングが大変だと感じることはありませんか?
特に、学習ツールとして連続的に会話をしたり、質問させて自分の考えを入力するときに「もっと早く入力したい」と考える人は少なくないはずです。

この記事では、ChatGPTへの入力を10倍早く、ラクにする音声入力の方法を3つ比較して紹介します。

音声入力とは?

音声入力とはその名の通り自分の言葉を使ってテキストを入力する方法です。
タイピングよりも確実に早く入力できる一方、音声からテキストへの変換精度を不安に思う方もいるかもしれません。
しかし音声入力を活用するとChatGPTへの入力だけではなく、普段の文章作成にも役立ちます。

今回紹介する音声入力ツールは以下の3つです。
・Chrome拡張機能『Voice In』
・ChatGPTアプリ標準搭載『Whisper』
・MacBook標準搭載『音声入力』

比較方法

ChatGPTへの初期プロンプトを以下のように与え、それぞれの入出力を比較してみました。

あなたは優秀なライターです。
ユーザーの入力文を以下の[条件]に従って成形してください。

[条件]
・読みやすいように適切に句読点を入れる
・必要に応じて段落で区切る
・「えっと」や感嘆詞を取り除く
・誤字脱字を修正する

それでは始めます。

このプロンプトをもとに、各ツールの特徴を音声入力しました。

入力文(私の音声入力をテキスト変換したもの)がどのような形式なのかをご覧いただけるとそれぞれの音声入力ツールの様子が分かると思います。

Chrome拡張機能『VoiceIn』

VoiceInはChromeの拡張機能の1つです。
導入方法はこちらの記事が分かりやすく、参考になります。

入力↓

次の文章を与えます同様に条件に従って文章を整形してくださいそれでは始めますこの文章はChromeの拡張期である拡張機能であるボイスインを使っていますボイスレインはGoogleの音声入力を利用して音声をテキストに変換しています特徴としては入力中の文字が画面上に表示されるので自分が今何をしゃべっているのかを確認しながらしゃべることができますまた変換制度はかなり高く高いですChromeの拡張機能なのでChrome上ので動いているアプリケーションであればチャットCPTに関わらず音声入力をすることができますただし句読点や記号が入らないので入力した文章をそのまま誰かに送るという点には向いていません

出力↓

この文章はChromeの拡張機能である「ボイスイン」を使っています。ボイスインはGoogleの音声入力を利用し、音声をテキストに変換します。特徴としては、入力中の文字が画面上に表示されるため、自分が何を話しているのかを確認しながら話すことができます。

変換精度は非常に高いです。Chromeの拡張機能であるため、Chrome上で動いているアプリケーションであれば、ChatGPTに関わらず音声入力をすることができます。ただし、句読点や記号が入らないため、入力した文章をそのまま誰かに送るという用途には向いていません。

ChatGPTアプリ『Whisper』

WhisperはChatGPTのアプリ(2023/6/9現在はiOS版のみ)に標準搭載されている音声入力機能です。
ChatGPTアプリをまだインストールしていない方はこちらからどうぞ

入力↓

次の文章を与えます 同様に条件に従って文章を整形してください それでは始めます この文章は ChatGPTのアプリに内蔵している Whisperで入力しています WhisperはOpenAIが開発した AIによる音声からのテキストへの変換アプリです 特徴としては入力に対して自動で 苦闘点がつくという点で ボイスインと異なる点があります 変換精度もかなり高いです 必要に応じて記号も付加してくれます ただし入力中の文章が画面に表示されないので フィードバックを得ながら 喋りたいという方は ちょっと難しい点もあるかもしれません ただしアプリを使って気軽に 音声入力できるという点では優れています

出力↓

この文章は、ChatGPTのアプリに内蔵されている「Whisper」で入力しています。WhisperはOpenAIが開発したAIによる音声からテキストへの変換アプリです。特徴としては、入力に対して自動で句読点がつくという点で、ボイスインとは異なります。

変換精度もかなり高く、必要に応じて記号も付加してくれます。しかし、入力中の文章が画面に表示されないので、フィードバックを得ながら話したいという方には少し難しい点もあるかもしれません。それでも、アプリを使って気軽に音声入力できるという点では優れています。

※ 紹介文内では「句読点が入る」と言っていますが、実際は句読点の入力は苦手なそうです。ここで修正させていただきます。

MacBook『音声入力』

MacBookに標準搭載されている音声入力でも試してみました。
「Macにそんな機能あったの?」という方はこちらからどうぞ。

入力↓

次の文章を与えます。同様に条件に従って場所を請求してください。それでは始めます。この場所はM1 MacBook Pro 2標準搭載されている音声入力機能使用してテキストを入力しています。特徴としてはおいしいと同様にリアルタイムで文字が表示されるので、フィードバックを回回ながら 文字入力をすることができます。また句読点もネットで入れてくれるので入れてくれます。ただし変換コール変換精度はおいしいんと比べると低いと感じます。入力された文字を予測して修正する機能があるのですが、これが英単語23して、かなり弱い子の文章題にも voiceペイント入れて102別に文字があります。クローム以外で動いているアプリケーション、例えばスラックなどで使用するのに向いていると感じます。

出力↓

この文章はM1 MacBook Proに標準搭載されている音声入力機能を使用してテキストを入力しています。特徴としては、リアルタイムで文字が表示されるため、フィードバックを得ながら文字入力をすることができます。また、句読点も自動で入れてくれます。

ただし、変換精度は一部と比べると低いと感じます。入力された文字を予測して修正する機能があるのですが、これが英単語を修正し、かなり誤解釈した文章を作り出すこともあります。クローム以外で動いているアプリケーション、例えばSlackなどで使用するのに向いていると感じます。

まとめ

今回は、音声入力の手法として3つの機能を紹介しました。それぞれに特徴があり、シーンによって使い分けるのが得策だと思います。

具体的には、ChatGPTをブラウザで使用する場合は『VoiceIn』を使用しましょう。シーンとしては、家でパソコンを用いた普段の作業にはVoiceInが有効だと感じます。

2つ目の『Whisper』は、ChatGPTをアプリで使用したい場合に活用できます。シーンとしては、散歩中や入浴中に文章を入力したい場合にはWhisperが有効だと感じます。

3つ目のMacBookの標準機能は、ブラウザ以外で文章を入力したい場合に活用しましょう。シーンとしては、SlackにGPTのbotを搭載している場合は、MacBookの標準機能で音声入力するのが有効だと感じます。

どの音声入力方法も優秀なので、シーンに合わせて全てを活用できるようにしましょう。このアカウントでは、ChatGPTの活用方法だけではなく、AI活用の考え方やエンジニアとしてのプロンプト開発について発信しています。是非記事のシェアとフォローをお願いします。


この記事が気に入ったらサポートをしてみませんか?