見出し画像

0396:文字起こしの進化

 家業の動画制作では、Adobe Premiere Proに数ヶ月前から実装されているspeech-to-text機能──いわゆる「AIによる音声の自動文字起こし」がとても便利だ。

https://helpx.adobe.com/jp/premiere-pro/using/speech-to-text.html

 それ以前は、仮編集した動画をyoutubeにアップして自動生成される字幕データをsrtでダウンロード、それをPremiereに読み込んで……という手間をかけていた。もちろんこれ以外にもgoogleとかAI文字起こしの手段はいくつもあった。ただ、動画編集作業をする者にとって、Premiereで直接それが実現できるのは「楽」のひとこと。専門用語とかボソボソ声とか仕方のないものを別として、認識精度も十分に高い。

 触れ返れば、公務員時代に私はどれだけテープ起こし業務に携わってきただろう。録音機器は当初はそれこそカセットテープ、途中からICレコーダになった。音声データはそのまま長期保存に向かない。テープはもとよりデジタルデータだって溜まれば記録メディアを圧迫するし、聴き直す人はまずいないからね。なので、議事録の文字起こしは必須の作業だ。

 予算のある時代は当たり前に外注に出していた。行政関係のテープ起こしには専門用語が頻出するから、適切な文字起こしのためには業界用語を知らなければならない。昔は(今もだろうけど)行政に強いプロ筆耕者がいて、本当に丁寧に文字起こしをしてくれた。彼は行政の勉強会にも顔を出して日々学んでおり、まさに「プロ」の名にふさわしい人だった。

 年々予算が圧迫されると共に筆耕外注費用すら惜しみ、「時間はかかってもいい」「全文でなく要約でいい」と自前で延々テープ起こしをする部署も出てきた。ICレコーダを何度も行きつ戻りつしながら、カシャカシャとワープロ入力していく地道な作業。時間外手当の方が高いんじゃないか、という気もしたが、人件費と物件費は枠が違う(これもおかしな話だけど)。

 一昨年くらいから、私のいた役所で試験的にAIによる文字起こしが導入された。同じ島の同僚が試してみたけれど、微妙な出来だったという。私は打鍵スピードが速いので、私が会議の場に居るときはその場でリアルタイムで7割方ワープロ打ちをし、帰庁後に音声データを確認しながら整形して概要記録を作ったりもしていた。しかし、議事録を要する会議がいくつも重なる状況だったので、ついには課の別の予算を回してもらって結局外注に出した。その後はコロナで会議が激減、テープ起こしの必要もなくなった。しかしいずれは元に戻る。

 あれから2年して登場したPremiereの自動文字起こし機能を経験すると、精度の向上は目覚ましいと感じる。私は利用していないが、違う話者の発言を聞き分ける機能もある。さすがに発言の意味内容で段落分けをするなどは今後も無理だろうから、完全にAIに任せるというわけにはいかない。それでも自分で音声を聴きながらワープロを打っていた往時に比べれば、自前でも遥かに短い時間で議事録が作れるようになった。技術というのは凄いなあ。

 こうなると、筆耕業者の仕事も少しずつ減ってくるかも知れない。業者こそAIを導入しているだろうけれど、そうすると人員はそれほど必要なくなってくる。ちなみに話。上述のプロ筆耕者はその後筆耕業務から撤退し、なんとパン屋に転身した。素晴らしく美味しいパンで、当地では一、二を争う人気店となっている。プロは何をやってもプロだ。

--------(以下noteの平常日記要素)

■本日の司法書士試験勉強ラーニングログ
【累積136h42m/合格目安3,000時間まであと2,864時間】
実績58分。4時間講義回だったので半分2回のみ視聴。

■本日摂取したオタク成分(オタキングログ)
『青天を衝け』第20話、一橋様が将軍に。幕末は幾度となくドラマ化されているけれども、誰を主人公(視点)に据えて何に注目して描くかで、全然様相が違ってくる。『交響詩篇エウレカセブン』第9~13話、ふおお、ふおおおお(語彙力)。子供たちの、エウレカの、月光ステートの過去が明かされる。そして、アネモネ。この物語の中心にいる人物。アネモネを筆頭に、本作はキャラクターの造型が本当に素晴らしい。どんだけ脳みそ絞ったらこんな物語を完成させられるのか。『鬼滅の刃 無限列車編』第3話、泣くよなあここは。この先に「俺の家族を侮辱するな!」がある。『王様ランキング』第2話、あの原作の(敢えていうけど)稚拙な表現を、ここまで丁寧にアニメ化するとは。なので展開はゆっくりめ。

この記事が気に入ったらサポートをしてみませんか?