見出し画像

ポッドキャストの音声ファイルをテキスト化・要約するSummary fmが便利、自力でChatGPTで作る方法との比較

ポッドキャストのエピソード紹介の要約を作るために2つの方法を比較してみました。1つ目は音声ファイルをボタン1つでAIでテキスト化・要約Summary fm。2つ目は文字起こし専用ツールCLOVA Noteでテキスト化してChatGPT-4で要約をする方法です。
結論、Summary fmで複数回要約出力を試すと欲しかった要約が手に入りました。
名称、単語の一部置換は必要ですが人力で全てを作るよりも楽にはなりました。

前提

下記エピソードの要約を作りました。

方法1 Summary fmを利用した作業工程

・株式会社stand.fmが提供するSummary fmに音声ファイルをアップロード、文字起こし〜要約まで自動(待ち時間 約1分)を5回実行

要約されたテキストの質 ○ 
文字起こしの精度 △
作業の手間 ○ (約1分を5回、合計5分)

結論:複数回出力を試すと欲しい要約が出力されました。

同じ音声ファイルを5回試したところ1回目は文脈が誤って伝わりそうな内容でしたが、4回目に欲しい要約が完成しました。
別の音声ファイルも複数種類のエピーソード試しましたが何度か試すと欲しい要約が出力される率が高いです。
音声ファイルによっては、たまに原因不明のエラーが出ます。
名称、単語など一部手動で置換が必要、言葉の使いまわしの加筆が必要なケースもあり。

Summary fmで欲しい要約が出力されたケース

ピースの小沢あやさんがホストを務める「働く女と○○と」は、毎回働く女性をゲストに迎えたトークプログラムです。本エピソードでは、三軒茶屋にある漫画喫茶ガリレオの店長、三田たたみさんが登場します。ガリレオは、オープンスペースのしきりがないタイプの漫画喫茶として、地元の方に親しまれているそうです。三田さんは、ガリレオの店舗を引き継ぎ、経営再建を果たした人物です。ガリレオの経営は、コスト的には家賃や電気代がかかりますが、月に150から200冊の新刊漫画を入荷して、増え続ける本数に対応しながら、お客様が漫画を楽しめるような棚作りに力を入れています。漫画喫茶業界でBL(ボーイズラブ)の棚を設置するのは珍しいという話もありました。ガリレオのお客様は、三田さんいわく、数十年通っているお客様が多く、リピート客の声やリクエストに応える形で、新刊漫画のセレクトをしているようです。漫画図書館として、地元の人に愛され続けているガリレオの空気感を味わえる本エピソードを聴いてみてはいかがでしょうか。

Summary fmで約1分で生成された要約。3つの単語を加筆済み。4回目の出力。

※下記3つの単語を加筆しています。
「小沢あや」←「小澤彩」 「三田たたみさん」←「三田畳さん」 「三軒茶屋」← 「三原ジャヤ」

方法2 CLOVA Noteで文字起こししてChatGPT-4で要約を作った作業工程

CLOVA Noteで文字起こし (アップロード完了まで約2分)
・文字起こしされたテキストを2,500文字程度に手動で編集(約3分)
ChatGPTで要約 (1分)を5回実行

要約されたテキストの質 ○
文字起こし(CLOVA Note)の精度 △
作業の手間 △ (合計 約10分)

一部の単語をプロンプトで指定。

CLOVA Noteで文字起こしをしてChatGPT-4で作った要約

「働く女と○○と。」のポッドキャストでは、ホストの小沢あやがゲストに三軒茶屋の漫画喫茶ガリレオ店長・三田たたみさんを招いています。三田さんは元々バイトで働いていたが、経営危機に陥ったガリレオを引き継ぎ、創業27年目を迎える地元の人気店に育て上げました。漫画喫茶ガリレオは明るく開放的な空間で、手前にBLコーナーも設置。新刊やメディア化作品を中心に、約4万冊の漫画が置かれています。三田さんは経営を立て直すため、最初の年は収入0円で働いていたと明かしています。

要約に使いたい文章を手動で選択、単語をプロンプトで指定。5回目の出力。

※文字起こしされた文章から要約に使いたい箇所を手動で選んでいるため伝えたいポイントを絞ることができている。

ChatGPTプロンプト

深津式プロンプトをベースにした要約プロンプト

#命令書:
あなたは、プロの編集者です。
以下に音声ファイルから書き起こしをしたテキストを制約条件と入力文をもとに、 最高の要約を出力してください。
#制約条件:
・文字数は140文字程度。
・重要なキーワードを取り残さない。
・誤字と思われる単語は修正してください。
・文章を簡潔に。
・番組名は「働く女と○○と。」ホスト名は「小沢あや」ゲスト名は「三田たたみさん」登場する漫画喫茶ガリレオは「三軒茶屋」にあります。
#入力文:

2,000文字程度の文字起こしテキストを貼り付け

#出力文:

プロンプトを自分なりにカスタマイズできればもっと便利になるかもしれません。

まとめ

Summary fmで何度か要約を試すと欲しかった要約が出力される場合がある。ただし単語などの加筆が必要。
複数回試してちょうど良い要約が出力されない場合は手動で編集した方が速い。

方法2ChatGPT活用の場合、長文を読み込めたり、番組情報のテキストを使い回すプロンプトを作れば要約の質と時間を短縮できるかもしれません。  
今後もいろいろな方法を試してみます。他に紹介文の作成などで良い方法をご存知の方は教えて下さい!


この記事が気に入ったらサポートをしてみませんか?