- 運営しているクリエイター
記事一覧
生成AIでインタビュー原稿を自動生成して、編集作業に集中できるようにしてみた
生成AIの活用によって、私のメイン業務である記事ライティングの仕事は大きく変わりました。以前から何回か、Whisper関連で記事を書いていましたが、ワークフローに少し改善があったので現時点での執筆スタイルをまとめました。
インタビュー音源録音まず、インタビューで音声を録音します。スマートフォンのボイスメモでも良いし、オンラインならZOOM録音でも良いです。普段は、TASCAMのリニアPCMレコー
ChatGPTとペアプログラミングしながら、長時間の音声録音を、実務レベルで精度高く文字起こしする
OpenAIのWhisper APIs、Google Colab、Pythonを活用して、長時間の動画や音源データの自動文字起こしの精度を上げる試みを続けています。(↓ これまでの記事)
その後、チーム内でプレゼンをしたり、周囲に宣伝して実績を増やしてみました。15件近く自動文字起こしを業務活用してみたところ、チーム内の負担が大幅に減り、業務効率を改善することができました。
それぞれニーズや
生成AIで長時間の録音を精度高く文字起こし & 要約 (WhisperとGoogleColabを使ってみた)
ある会話から「プレゼンの正確な書き起こしや、動画のスピーチ内容を正確に要約したい」というニーズがありました。おそらく、毎回動画や音声を聴いて書き起こしを行い、その後に要約記事を作成するというフローが存在していたのかと思います。
そこで「ChatGPT」で有名なOpenAI社の提供しているAPIを活用して、長時間の映像や音声などの書き起こしや要約にチャレンジしてみました。
実は以前から、テキスト
生成AIで長時間の音声録音を、更に精度高く文字起こしする (WhisperとGoogleColab)
OpenAIのAPI(Whisper)、Google Colab、Pythonを活用して、長時間の動画や音源データの自動文字起こしをする試みについての続きです。(前回の記事)
実際の業務でも充分活用できるのがわかったので、Whisperによる文字起こしの精度や、パフォーマンスを改善するために、少しだけカスタマイズしてみました。
Whisperのパラメーターにヒントを与える。Whisperの文字