オンライン会議に参加しながらオンライン会議の内容の音声認識の編集はできるのか

2021年5月26日 12:07

※在職エントリの内容を抜粋・編集。

現在担当している業務は音声認識システムを利用した文字起こしシステムであるAI Minutesの編集になる。

そんな事で、業務で音声文字認識のシステムに触れている最中、Googleの音声文字変換アプリ(Android)を用いたリアルタイムでの音声文字認識システムが一時期話題になった。1行あたりにおける表示数などAI Minutesと異なる点はあれど、良いシステムだなと思った。

#xdiversity @xdiversity_org #stayhometokyo #音声文字変換 pic.twitter.com/VNKQcZONsR
— 落合陽一 Yoichi OCHIAI (@ochyai) May 13, 2020

PC＋Android＋無料のツールだけで自動音声認識による字幕付き配信（ウェブ会議）をおこなう方法を紹介してみました。広く普及して常識になって欲しい（すべてのウェブ会議システムがデフォルトで対応してくれてこの動画が無駄になることを希望）。 #xdiversity pic.twitter.com/yhuT5HISxW
— Yoshiki NAGATANI (@nagataniyoshiki) May 18, 2020

所属研究室でのリモートミーティングで，どうやって音声認識を活用しているかGitHubにてまとめました！また，そこで発生した課題などについても触れていますので，ご興味のある方や参考にしたい方は是非どうぞ！

▶︎GitHubhttps://t.co/eLViNHBy9o @labDNG @xdiversity_org #xdiversity pic.twitter.com/WD9T4aJBhY
— Thetaθ Akihisa / Akihisa Shitara (@Theta_Tsukuba) May 20, 2020

この、Googleの音声文字変換アプリ(Android)を用いたリアルタイムでの音声文字認識システムを使う様子を見ていた時に、AI Minutesの音声認識システムと編集システムを使いながら「自分が現在参加しているビデオ会議の音声を会議に参加しながら編集できるか」と考えたので個人的に会社概要の動画を用いながら試してみた。

結論として「自分が現在参加しているビデオ会議の音声認識の内容をビデオ会議に参加しながら編集する事はできない」という事になった。
音声認識の内容を編集する上では、頭の中で思い出しながらやっていては次から次へと進む会議の内容に追いつかないという点と、音声認識の結果を正しい内容に修正するためにはどうしても音声を聞き直す作業が必要になるという点が生じる。
そして、進行中の会議参加者の音声と聞き直しの音声が二重に聞こえて会議に参加する事が難しいという事に至った。よって、私の中では、会議参加者とは別に音声認識システムの認識内容を編集する人が必要だという結論になった。

この掲載内容は私自身の見解であり、必ずしもIBMの立場・戦略・意見を代表するものではありません。

-end-

読んだ後は投げ銭のほどよろしくお願いします。日々の活力になります。Amazon欲しい物リストもよろしく：https://www.amazon.co.jp/hz/wishlist/ls/9FWMM626RKNI