見出し画像

ChatGPTを使ってスマートな議事録を作ってみた

病院では、数多くの委員会や会議がある。

会の終了後は議事録作成に時間を取られる。録音した音声を発言者ごとに文字起こしし、その文章を校正する。

ほぼ全てが人力である。

1時間の会議であれば、議事録作成に1日ぐらいかけているのではないだろうか(他の仕事をやりながら)。

最近は文字起こしソフトが充実してきており、ChatGPTなどAIとの連携も可能になってきている。そこで、最新の文字起こしソフト「Exemplary AI」を使って、文字起こしから文章校正までをどれだけ短縮化するかを試してみた。

文字起こしに使った動画はこちら

発言者を区別するExemplary AI

「Exemplary AI」は、 発言者によって、Speakerを区別して文字起こししてくれる。

動画ファイルをアップロードすると、スピーカーが何人いるかが表示される。

2人の打ち合わせであることをAIが認識

実際、私と武田(うちの事務所の職員)の2名が話をしていたが、しっかりと区別してる(Speaker 1および 2)。ちなみに4名の会議(男性のみ)でも実験してみたが、しっかりとSpeaker1から4まで区別していた。

文字起こしの精度はどうか?

肝心の文字起こしの精度はどうだろうか?

発言者ごとに文字起こし

単語間に謎なスペースがあるとか、句読点がないなどの問題があるものの、しっかりと会話が再現されている。

文章校正にChatGPTを使う

しかし、このままでは提出用の議事録にはならないので、一手間かける。そこで登場するのがChatGPTである。「Exemplary AI」により文字起こし文章をテキストエディットにダウンロードし、それをChatGPTにコピー&ペーストする。

テキストエディットにダウンロード


ChatGPTはプロンプト(命令文)が大事!

ということで、下記のような命令文で質問する。特に重要な条件はケバ取りである。口語にありがちな「つなぎ言葉(えー、このー)」を削除する指示をすると特段に読みやすくなる。

条件①から④に基づき、下記文章を変更してもらえますでしょうか?
#条件
①「Speaker 1」を「長」に変更し、「Speaker2」を「武田」に変更。
② 文章にある単語間のスペースを埋めて繋げる。また、句読点を適宜入れる。次のように表示。
(長)今日は自宅ですか?
(武田)そうです。
ケバ取り(「あのー」、「えー」、「えーと」、「うーん」などといった、それ自体では意味をなさない短い言葉を削除)
④ 文章の流れ的に変なところは適宜削除もしくは修正

プロンプト(命令文)は細かければ細かいほどいい

わずか2〜3分で下記のような文章に。

(長)入社してどのくらいになりました?
(武田)今9月だと半年ですね。
(長)半年ですか、あっという間でしたね。
(武田)でもそうですね。
(長)いやすごいですよね。入社した当時は心配していたかもしれませんね。初めて在宅勤務をやっている中で、武田さんが初めて入社された人だと思いますよね?
(武田)そうですよね。面接から一度もお伺いしなかったので、結局私は一度もお会いしなかったんです。
(長)それなのに事務所を見ずに来ちゃったんですね。その辺は抵抗感はなかったんですか?
(武田)特に抵抗感はありませんでした。


おそらく人力による文字起こしで時間がかかっているのは「Speaker 1」を「(長 )」に直すとか、半角を詰めるとか、句読点を加えるところではないだろうか?

これがChatGPTだと一瞬で変換をしてくれる。

最後は人力も必要

ChatGPTも万能ではなく、固有名詞(地名や人名)については苦手である。驚きだったのは日本製の製品であるDocuWorksを文字起こしソフトは正確に読み取れなかったが、ChatGPTでは正しいスペルで直していたことである。

ドキュと略語で喋ったら「毒」と文字起こしされた
ChatGPTではDocuWorksと正しく表示

おそらくChatGPTは前までの文章の流れで「DocuWorks」を使うべきと判断したものと思われる。

ChatGPTにより90点ぐらいまでは持っていけるが、最終編集はやはり人によりすることになる。しかし、ゼロから校正するのと比べれば全然楽である。

9分弱のYouTube動画ではあったが、最終的な文章にするまでにかかった時間は10分程度であった。これを人がすべてやる場合であれば1時間はかかるのではないだろうか?

本文にあるChatGPTへの命令文はどんどん皆様に活用していただき、ルーチン業務である議事録作成から解放されることを祈るばかりである。


この記事が気に入ったらサポートをしてみませんか?