ChatGPT:音声入力テキストをChatGPTで推敲
以下の野口教授のChatGPTの利用した、音声入力テキストの推敲方法を、試してみる。
overview
音声認識による文章生成と、生成された文章の推敲を、人工知能を使って、効率化できるかを検証する。
orientation
以下の手順で、音声入力し、ChatGPTによる推敲までをしてみる。
1. Outline Editor(Workflowy)で、話す内容の文章構成を簡単に整理する。
2. AutoMemo(デバイス)に対して、文章構成をもとに口述して、音声認識により、テキスト化する。
3. GMailに転送されたテキスト・データを取得する。
4. ChatGPTにQueryを投げて、推敲してもらう。
音声入力時間(4 min 54)
テキスト化文字数 873文字
Q: 次の文章 <text> をもとにして、ほぼ同じ文字数の文章を書いてください
ChatGPT Answer
この投稿では、ChatGPTを使用して文章の作成を効率化する方法について考えています。・・・省略・・・
Q: 上記の回答を、適度に段落を入れて、読みやすく、パラグラフごとに、分離してください。
ChatGPT Answer
この投稿では、ChatGPTを使用して文章の作成を効率化する方法について考えています。
野口教授は、ChatGPTを利用した文章の入力を効率化する方法についての投稿を行っています。野口教授は、ITを活用した文章作成の効率化に関するさまざまな情報を提供しており、非常に参考になります。
私は今回、野口さんの説明に従って、音声入力を使用してChatGPTを試してみることにしました。実際、私はすでにスマートフォンなどを使って音声入力を利用しています。音声入力は、散歩中に思いついたことをテキスト入力する際や、ジムで運動しながらメモを取る際に利用しています。また、読書中には寝転がりながら文章や思いつきを音声入力でメモするようにしています。そして、寝る前にはベッドの中で思いついたことを音声入力しています。
音声入力には、スマートフォンを使用しているため、現在は2つのアプリを使用しています。1つ目はオートメモソースネクスト製のアプリで、もう1つはストッカーという名前のアプリです。オートメモは、専用のハートデバイスで録音された音声をテキストに変換し、Gメールと連携することができます。ストッカーは、共有を通じてメモをGメールや他のアプリに転送することができます。以前はGoogleキープや他の音声メモアプリを使用していましたが、現在は説明した2つのアプリを使用するようになりました。
実際に使用してみると、音声の認識が特に固有名詞に関しては上手くいかないことが課題です。現在は、Gメールに転送された音声入力のテキストを読みながらキープなどに転記しています。
今回、野口教授の音声入力データをChatGPTで処理する方法がどれだけメリットがあるかを検証してみたいと思います。効率化が見込まれる場合は、今後も積極的に活用していきたいと考えています。
(785文字)
conclusion
以下の結果であった。
話す内容を整理した文章の骨格:397文字
音声入力でテキスト化された文:873文字
ChatGPTで推敲後:785文字
パラグラフごとに、分割を依頼することで、文章自体も読みやすくなった。
「話し言葉」では、「である」口調で話したが、推敲後は、「です、ます」口調の表現で統一された。
なお、上記の文章を、「です、ます」口調を、「である」口調に変更するように、ChatGPTに指示したら、「である」口調に推敲された。
文章を書くのに慣れているのであれば、文章の骨格を整理して、それをもとに、普通に文章を書けば、実際に、すぐに800~1200文字くらいは書ける。
が、文章を書く際に、骨格をもとに「どこまで、どう書くか」は、書き手の悩みでもある。とりあえず、音声入力を使って、800文字くらいをテキスト化できるのは、「文字起こし=>推敲」までできるので、メリットがある。文章作成の効率化の一助となると言える。
音声入力は、気軽で、速く入力できる。音声認識の精度が上がっており、95%程度は、音声入力で充分に正しくテキスト化可能と考える。キーボード入力は、考えが煮詰まっていると、入力にハードルがあるが、音声入力は、ボサボサでバサバサでも気にせずに入力できるのが最大のメリット。
discussion
音声入力では、以下の課題があり、それを、ChatGPTの推敲により解決できているとは言い難い。
誤変換
上記の文章では推敲されていた(転寄→転記)
表記ゆれ
上記の文章であれば、「野口教授」「野口さん」
同じ言葉の繰り返し
英語表記の修正が必要
上記の文章であれば、製品名であるGmail, Google Keep, AutoMemo, Stockr, etc
等
また、「話しことば」では、論理展開などで、さほど気にしない表現でも、「書きことば」では、論理展開の不整合などが、どうしても気になる。
音声入力時の入力内容が、曖昧だったり、論理的に不整合だったりしているわけで、この辺は、自分の説明能力の不備を反省するべきである。音声入力で、今後、文章を作成していく場合、「話し方」としての説明スキルも磨くことが必要と思われる。
今回は、文章の骨格を作って、音声入力したが、次回は、プレゼン資料をもとに、音声入力をするのを試してみる。
以上
Appendix
以下、上記で使ったアプリ、デバイスのリンク。
AutoMemo
Stockr
日々の気づきを、ストックすることを、主な機能として提供しているアプリ。メモとしてのテーマを設定しておき、そのテーマ等に対して、メモを残す形式。
音声入力に特化したアプリではない。音声入力は、Androidの音声入力機能を利用している。
System Development業界、Software Engineering、Scriptingについて、発信してます。サポートありがとうございます。