「Notta AI」で動画の文字起こし
今週は、アプリケーション新機能の利用者向け研修案内のチラシと研修プログラム作成の打合せをしました。
システムを開発したけど、機能説明や使用方法の研修に人手や時間を割けない、プロに任せたいという開発会社様のお仕事をミナルキで受けているので、その打合せです。
打合せでは動画を撮りながら商品のレクチャーを受けます。
それをミナルキ制作スタッフと共有し、研修プログラムを作っていくんですが…。
研修なので間違いがあってはならないから、動画を細かく確認し、記録を残すために文字に起こし、要約し、スタッフと共有します。
この、細かく確認、文字起こしに時間がかかる。けっこう大変な作業です。
しかも、音声をただ文字にするだけという単純な誰でも出来る作業。これに優秀なスタッフの時間を使うのはもったいないと思ってたんですよね。
そこで、生成AI研究会で教えてもらったAI議事録ツール「Notta」を使ってみました。
音声の文字起こしの精度が凄い。音声を文字にしてくれるAIツールを検索すると10いくつヒットします。その中で、「Notta」は精度が高いという評価をしている人が多いし、私に教えてくれた人もすごく役に立っていると言っていました。実際に使ってみて、予想以上だと思いました。
音声が正しくそのまま文字になったわけではありません。間違いも結構あります。こんな感じで。
凄いと思ったのは、人間の話って無駄が多いんですよね。その部分をカットし、前後の文脈から判断して文章を繋げていると思われる文字起こしをしているところ。間違いが聞き間違いでは無く、「ああ」とか「うう」とか「ごにょごにょ」言ってて聞き取れないところとかをカットし、きちんとした文を作っているんです。しかも人間よりずっと早いスピードで!
人に任せるとその人のスキルによって完成した文章の善し悪しがだいぶ変わるので、何時でも変わらない成果が得られるのは安心です。やってくれる人がいなくて、忙しいのに今回自分でしないとダメかぁ、と涙することも無くなりそうです。
その上、この文字起こし本当に正しいの?と思ったとき、人間の文字起こしだと文字と音声がリンクしていないから、音声の方を多分何分後ぐらいにしゃべってることだろうと当たりをつけて確認しなければならないけど、「Notta」は文章を短く切っていて、その部分の再生ボタンをクリックしたら音声の確認が出来るから、手作業の時の動画を何度も進めたり戻したりして確認するという作業が無くなりました。
ウチの文字起こしは、これを使って何かするというよりは後から確認するときのための保存用なので、ここにあまり時間をかけたくなかったんです。良いツールが見つかったと思います。
弊社はAI-OCRも扱っています。音声では無く、文字のアナログデータをデジタルデータに変換するツールです。
これをお勧めしたとき、お客様に「AI-OCRは100%正しく認識しないから使えない」と言われることがあります。何故か言う人は100%年配の男性です。何故か…。ITに対する期待が高いのかな?
実際に使う人たちの意見は「間違っているところは直せば良い。どうせWチェックするんだから最初の大変な部分をAIがしてくれるなら、凄く助かる!」です。
AIの有効活用は、完璧は求めないけど、機能を最大限生かす事ですね。
「Notta」をしっかり活用して、楽しようと思います。
この記事が参加している募集
この記事が気に入ったらサポートをしてみませんか?