見出し画像

ChatGPT:音声入力テキストをChatGPTで推敲②_2306

以下の投稿では、音声入力により生成したテキストを、ChatGPTに推敲してもらった。
本投稿では、Desktop PCで、音声入力を活用した生産性向上が可能かを、検証する。

overview

  • 上記の投稿で使用した音声認識アプリは、アプリ側が、発話の際の文の切れ目に対して、「読点」などを、補ってくれるものであった。

  • 今回は、Windows 11で、音声入力を利用して、テキスト入力する。

orientation

  • 以下のアプリケーションで、音声入力を行い、検証する。

    • Microsoft Word

      • Microsoft OfficeのDictate

      • Microsoft OfficeのTranscribe

    • notepad

      • Windows 11 標準の音声入力(win+Hで起動)

Microsoft Word - Dictate

マイクロソフトワードの音声入力は結構性能がいい。 ただ連続的に話をすると 句点や読点がうまく ふられずに ぶつぶつとした文章になる。 マイクロソフトワードでは音声入力の際に キーボードで 文章を修正しても 音声入力モードから フォードが変わらずに 編集後も そのまま音声入力が可能である このメリットは大きい 他の音声入力では キーボードをいじると 音声入力モードがなくなり 再度音声入力する際は 自分でモードを切り替える必要がある

音声入力が切り替わらないので自分で句点や読点を打ちながら 文章を作成する ことも可能である。

マイクロソフト製品の onenote でも 同様に入力は継続できる。 なので音声入力はマイクロソフト製品でやると メリットはある その際に 句点、読点、改行という問題は存在する。

音声入力で止めどもなく入力した後にチャットgptでその文章を推敲させれば。、がきちんと整理して入力が可能であろう それを試してみる。

Q: 以下の文章を推敲ください。なお、パラグラフに分けてください。

以下の文章 <text> を推敲ください。なお、3つ以上に、パラグラフに分けてください。

### text
マイクロソフトワードの音声入力は結構性能がいい。 ただ連続的に・・・(略)

ChatGPT Answer

パラグラフ1:
マイクロソフトワードの音声入力は結構性能が良いです。ただ、連続的に話をすると、句点や読点がうまく挿入されず、ぶつぶつとした文章になってしまいます。

パラグラフ2:
マイクロソフトワードでは、音声入力の際にキーボードで文章を修正しても、音声入力モードからフォーカスが変わらず、編集後もそのまま音声入力が可能です。このメリットは大きいです。他の音声入力では、キーボードをいじると音声入力モードがなくなり、再度音声入力する際は自分でモードを切り替える必要があります。マイクロソフトワードなら、音声入力が切り替わらないので、自分で句点や読点を打ちながら文章を作成することも可能です。

パラグラフ3:
マイクロソフト製品のOneNoteでも、同様に音声入力は継続できます。ですので、音声入力を行う場合はマイクロソフト製品を利用するとメリットがあります。ただし、句点や読点、改行といった問題は存在します。しかし、音声入力で止めどもなく入力した後にChatGPTでその文章を推敲させれば、句読点がきちんと整理された入力が可能でしょう。この方法を試してみることをおすすめします。

Microsoft Word - Transcribe

  • トゥールミン・ロジックを説明した図をベースに、初見で、図の説明をした内容を、録音して、その音声データを、Microsoft WordのTranscibeで、テキスト化した。

  • で、自分の話した内容をベースに、文章を精査して、起こしてみた。起こした文字は、982文字。

Q: 以下の文章をもとに、論述ください。なお、パラグラフに分けてください。

以下の文章 <text> をもとに論述ください。なお、5つ以上に、パラグラフに分けてください。
### text
今回は、トゥールミン・ロジックについて、考えたいと思います・・・(略)

ChatGPT Arguments

トゥールミン・ロジックは、分析哲学者であるトゥールミンによって提案された論理の枠組みです。このロジックは、論述や説明において重要な要素を整理し、論理の組立てや構造、評価について論述するための指針となります。このような要素を適切に捉えて相手に伝えることは、論述や説明のポイントとなります。

トゥールミン・ロジックでは、論述や説明の主体となる要素と、それを補足する要素の提案がなされています。主体となる要素は、以下の3つです。まず、「Claim(主張)」は結果や結論を示すものであり、「Warrant(論拠)」は主張を支持する根拠や理由を示します。「Data(根拠)」は主張や論拠を裏付けるエビデンスや具体的なデータを指します。これらの要素は三角ロジックと呼ばれます。

さらに、トゥールミン・ロジックでは、この三角ロジックに加えて、「Backing(論拠を裏付ける論証)」、「Qualifier(確からしさ)」、「Rebuttal(反証)」という要素を提示しています。Backingは、科学的な証明や法的な根拠、社会的に一般的に認められる常識など、主張や論拠を裏付けるものです。また、Qualifierはデータと主張の論理的なつながりを示し、主張を特定の状況に限定することを意味します。Rebuttalは、データや論拠に対して反論や反証が存在することを考慮します。

トゥールミンは、論証や説明を展開する際に、これらの要素を考慮しながら進めることを重要視しています。これによって、論理的な強さや説得力を高めることができるとされています。例えば、論拠を裏付ける論証や確からしさの限定、反論の考慮などが、より信頼性の高い論述や説明を構築するための手法となります。

このようなトゥールミン・ロジックの枠組みを理解することで、我々はより効果的な論述や説明を行うことができます。論理的な組み立てと具体的な根拠の提供によって、自身の主張や意見を他者に理解してもらいやすくなるでしょう。また、反論や反証を考慮することで、より客観的かつ包括的な議論が可能となります。

このトゥールミン・ロジックの指針は、さまざまな分野や場面で活用されています。例えば、学術論文やビジネスプレゼンテーション、政治的なディベートなど、意見や主張を論理的に構築し、説得力を持たせるための手法として役立っています。より効果的なコミュニケーションを実現するために、トゥールミン・ロジックの考え方を学ぶことは非常に有益です。

(1056文字)

notepad - Windows 11 Speech to Text

  • 以下、notepadで、Windows11の音声入力機能で、テキスト化してみる。

Q: 以下の文章を推敲ください。なお、パラグラフに分けてください。

以下の文章 <text> を推敲ください。なお、3つ以上に、パラグラフに分けてください。

### text
本当コーデは? Windows OS。をディスクトップで使い・・・(略)・・・(706文字)

ChatGPT Answer

以下に推敲した文章をパラグラフごとに分けて示します。


パラグラフ1:
Windows OSをデスクトップで使用しながら音声入力を行い、・・・(略)
(628文字)

Q: 以下の文章をベースに、Blogを書いてください。

以下の文章 <text>をベースにBlogを書いてください。
### text
パラグラフ1: Windows OSをデスクトップで使用しながら音声入力を行い、・・・(略)

ChatGPT Blog

ブログ:音声入力を活用して生産性を向上させる方法

最近のテクノロジーの進化により、私たちはますます効率的に作業を進めることができるようになってきました。その中でも、音声入力は生産性を向上させるための便利なツールの一つです。特に、Windows OSをデスクトップで使用しながら音声入力を活用し、それによってチャットGPTを利用する方法は、注目に値するものです。

まず考えられる方法は、マイクロソフトワードを音声入力用のツールとして利用することです。マイクロソフトワードには、ある程度の音声入力が可能な機能が組み込まれており、テキストをキーボードで修正したり変更したりすることもできます。しかし、通常のOSとして音声入力を利用する場合は、キーボードを使用すると音声入力モードが終了してしまいます。この点については、改善の余地があります。

また、もう一つの方法として、普段使っているツールで音声入力を活用することも考えられます。たとえば、ノートパッドなどのアプリケーションを使用して文章を入力する際に、音声入力を利用するのです。この方法の利点は、どんどん文章を作成できることです。しかし、音声入力時にミスがあった場合は修正が必要になります。自分だけが見るようなメモについては音声入力で入力することに問題はありませんが、後で読んでも意味の分からない文章になってしまう場合は意味がありません。

そこで、チャットGPTを利用して音声入力したテキストを修正する方法が一つの解決策です。音声入力を利用してデータとして文章を作成し、後で精査していくことができます。チャットGPTは、自然言語処理のモデルであり、文章の文法や意味を理解し、より正確な表現に修正してくれます。これにより、データとして利用できる文章をどんどん作成し、音声入力を活用してその内容を改善していくことが可能となります。

音声入力を活用することで、作業効率を向上させるだけでなく、体の負担も軽減されます。キーボード入力に比べて手を動かす必要がないため、疲れにくくなりますし、作業中に他のことに集中することもできます。また、音声入力は特に文章作成において大いに役立つツールです。思考を言葉にすることで、よりスムーズにアイデアをまとめることができます。

生産性を向上させるためには、新しいテクノロジーを積極的に取り入れることが重要です。音声入力とチャットGPTの組み合わせは、仕事や創造的な活動において有用なツールとなることでしょう。将来的には、より高度な音声認識技術と言語モデルが開発され、より精度の高い文章作成が可能になるかもしれません。私たちはこれらの技術の進歩を期待しつつ、今日からでも音声入力を活用して生産性を向上させることができます。ぜひ試してみてください。

(1117文字)

conclusion

  • 本投稿では、Windows Desktop PCで、音声入力を利用した生産性向上について、検証してみた。

    • Windowsの音声入力では、「読点」、「句点」が音声入力の際に、付与されない場合が多い。「トウテン」「クテン」と、意識して発話して入力することは可能。

    • 「カイギョウ」も意識して発音すれば、改行して、パラグラフを分けられる。

    • ChatGPTに、推敲してもらうことで、「句点」「改行」をChatGPTに付与してもらえる。が、「読点」はあまり付与されなかった。

  • リモートワークで、自宅で作業する場合は、パソコンに向かって、音声入力して、独り言を言い続けても、問題無いと言えます。

  • 文章作成にて、音声入力とChatGPTを組み合わせて使うことで、ある程度の量の文章を、結構、簡単に作成が可能です。簡易に作成した文章をベースに、論点などを見直し、伝わる文章に変更していけば、文章作成のハードルが下がると、感じました。

    • 音声入力で作成した文章を、ChatGPTで推敲させて、その推敲文をベースに、ChatGPTにBlogに投稿する文章を生成させた。

    • 文章作成側の意図が反映されており、それなりに読める文章にはなった。ただ、ところどころ、音声入力の論理不備があり、生成された文章に、その論理不備が引き継がれているところがある。

  • 音声入力やChatGPTは、あくまで、補助ツールです。文明の利器が与えられたわけで、補助ツールとして使っていけば良いのです。

  • 文章を作成する側は、より、その文章の伝えるべき内容に、集中して精査できるようになり、その分のメリットはありそうです。

  • ただ、最初に口述で、音声入力する内容がプアだと、推敲に、却って時間がかかるし、最初の文章に引きずられてしまう可能性もあります。

  • これからの文章作成は、構成力編集力が重要になるように、感じました。

System Development業界、Software Engineering、Scriptingについて、発信してます。サポートありがとうございます。