見出し画像

DaiGoさんが何言ってるか分からない!Zoom・YOUTUBEの音声を自動認識させる方法

前々から、YOUTUBEのビジネス系動画は毎日寝る前に見ていたんです。その中でもDaiGoさんの動画にはテロップ1つ付かない上、めちゃめちゃ早口なので読唇術が追い付かないのが難点だった。

さらに、産業カウンセラー養成講座のe-Learningに、30分ほどの動画が20本くらいあるんです。先週あたり連絡がきて、6時間ほどの座学が1本飛び、これもe-Learningになると。そして逐語記録といって、カウンセリングをレコーディングして、一語一句を全部文字起こしするという課題があるんです。専門用語もたくさんある上、人工内耳してるからといって100%分かるわけじゃないので、これちょっとヤバいぞ何とかしよう、と。

Googleドキュメントの音声認識の精度がバツグン

UDトークも善戦していますが、やはりGoogleドキュメントの認識精度は非常に高いです。あまりに便利なので、手話動画を読み取りながらスマホで音声入力による文字起こしをし、動画に字幕を付けるということをやっていたりします。

やはりここはGoogleドキュメントを中心に、認識させる方法を探したい!

1台のPCで動画再生と文字起こしを同時に

音声の質は認識精度にも影響する。じゃあ、PCで再生した動画音声を内部でそのまま利用する形にして、Googleドキュメントで認識すればいいじゃん?って思ってそこから調べたらナイスなサイトが。
YouTube動画の音声をGoogleドキュメントで自動的に文字起こしする方法

だがしかし、この通りにすんなりいかなかった。そこで仮想デバイスを増やせばいいんだということで調べなおしたらこちらに。
音声データを自動文字起こしする方法とは?【Windows】VB-Audio Virtual Cable

このソフトを入れなさいということらしい。VB-Audio Virtual Cable
サウンド設定については先ほどのサイトに詳しい。

早速、DaiGoさんの動画で試してみた。

PC1画面で同時に文字起こしが出来た。この動画はキャプチャーなので、PC内部での音声が入っているが、こちら側には聞こえてこない。PC内部で音の入力と出力をループさせてる?から、音が出ない。

音なんか要らないよという人や、あくまで動画に字幕を入れる際の作業効率アップに使う感じ?
この状態でスマホとPCそれぞれのZoomを起動すると、このPC内部の音声がスマホから大音量で流れてくる。ということは普通にZoomの会話も文字起こしが出来るのでは?と思い、早速試してみた。


Zoomでの会話の文字起こし 議事録にも使える?

設定はとても簡単。Zoomマイクの設定で、入力も出力もVB-Audio Virtual Cableを選択。PC本体のスピーカー設定もCABLE Inputにしないとだめっぽい。PCとスマホの両方でzoom起動して、スマホで喋ったらPCのほうで文字起こしが始まった。これは議事録に使えるかも?

もっと調べれば、この文字起こし画面を共有ではなくカメラ映像の代わりに表示させることもできるのかもしれない。だけどもっともアナログで簡単な方法は、自分の顔はPCで映し、PCをスマホのZoomカメラで映せばよい(インカメラではなく外向きカメラで。でないと文字が反転する)。

無題

無題2


相変わらず、PCの音声はこちらに聴こえないので、2つのデバイスで同時に音声出力する方法を探してみようと思って悪戦苦闘している。

なお1つはBluetooth。給付金が出るので、人工内耳のCochlear Nucleus7用 ワイヤレスアクセサリ「ミニマイクロホン 2 プラス」を購入。PCのストリーミング音声を人工内耳に飛ばせるというもの。

お陰でパソコンの音は苦もなく人工内耳で聴けるようになったのは便利。だがしかし…

画像4

プレゼン

②と③を同時に使いたいんです。。くぅ。
分からなくていじりまくって、復元ポイントまで戻したよ…
これが同時につかれば、PC1台だけで音声を人工内耳で聞いて、文字の情報保障も同時に出来るのだけど。ヒント落っこちてないかなー


よろしければサポートをお願いします!頂いたサポートは、活動費にさせていただきます。