見出し画像

自動文字起こしとChatGPTで議事録作成って実際どうなのよ?

結論:
おそらく現段階では手直しする部分が多かったり、制約も多く実際運用するにはかなりの工夫を要する。

こんにちわ、ふと思いついて便利そうだなぁと思いやってみました。
サクッと試してみましょう

考えるべきは会議を文字起こしをする手段。
テキスト化さえできれば後はGTPに流すだけである。

主にZOOMであることが多いので大体2通りになる
・Zoomの自動字幕機能を使う。
・Googleドキュメントの音声入力機能を使う。

今回はSlackなど幅広く対応でもできるようGoogleドキュメントの音声入力機能を活用した。

参考にしたのはこちら↓

以下は実際にやってみた様子です。

まずは音声のテキスト化、会議を想定してBGMがない動画を選定して試します。
何も考えずGPT4にテキストを無加工で流したところ
議事録の精度としては完璧でした。

欠点は
・たまに音声入力が終了するので自分が積極的に会議に関わっていると対応できないこと
・ミーティング中Googleドキュメントを常にアクティブにしていないといけないこと
・それができなきゃ録画しておいてもう一度再生するが倍速すると音声を認識してくれないこと
・2PCでないとリアルタイムでの修正もできないため誰が話しているのか記録できないのは複数人の会議では致命的

ということで冒頭の結論に繋がります。
結論:
おそらく現段階では手直しする部分が多かったり、制約も多く実際運用するにはかなりの工夫を要する。

結局誰が発言したかを追記したり、録画したものをもう一度文字起こしさせたりするくらいなら、自分で会議参加しながら手入力したほうが早いです。
だいたい会議終了から15~30分以内に議事録提出してますし、録画下の使っていたら1時間の会議だったら1時間後になってしまいます。作業に使わないPCが別にあるならまだマシですが…

かなーり良い線来ていただけに、なんとかならないかなぁと考察中です。
AIの進歩はほんとに凄まじく、脳みそはかなり実用段階ですが、AIに情報を入力する手段がまだ貧弱なのを感じますね。
例えば画像認識技術や、音声の認識性能があがって、AIが世界を知るための手段が充実すれば、もっと画期的でまさにシンギュラリティが起こるのではないかと期待しています。

この記事が参加している募集

#AIとやってみた

27,861件

この記事が気に入ったらサポートをしてみませんか?