見出し画像

閣僚の就任会見を「音声文字起こし」してみてわかったこと【#ゆるテック余滴】

朝日新聞の研究開発チーム「ICTRAD」の野口です。研究開発チームの一員ではありますが、ちょっと前まで記者として働いていたこともあり、朝日新聞のウェブメディア「withnews」で記事を書く仕事もしています。

先日、菅内閣の閣僚の就任記者会見を音声認識技術を使って文字起こししてみたら……という記事を書きました。内容については下記記事をご参照ください。ネットでアクセスできる音声・会見テキストを使って分析しています。

このときエンジニアとして技術部門に戻ってきて1カ月ほど。ブランクがありすぎて、サーバーの秘密鍵の生成もままならず、後輩たちに全方位五体投地して教えを請い、毎晩枕を濡らし、時に奇声を発しながら書いた記事です。

というのはだいたい半分くらいは冗談ですが、「閣僚会見」を調査する中で初めて知ったあれこれがありましたので、裏話としてお話できればと思います。(技術の話はほとんどありません…すみません…)

なぜやったのか

まず、なぜこの調査を企画したのかだけご紹介させてください。

スマートスピーカーや音声アシスタントなど、音声認識技術は生活の一部になりつつあります。ニュースの世界でもABEMAの「AIポン」をはじめとした、リアルタイム字幕でも活用が期待されています。

しかし、人間とは違う「機械の耳」で聞くからこその誤変換もあります。例えば、イチロー選手の引退会見の字幕が話題となったことは記憶に新しいのではないでしょうか。

アクセシビリティの観点からも、重要なのはその精度です。現在の精度はどれくらいなのか、また誤変換がどんな時に起こるのかを調べてみたいと思いました。

対象にしたのは閣僚の就任記者会見

爆音のクラブより静かな個室の方が会話が成り立ちやすいように、音声認識もノイズは大敵です。ノイズ除去技術も発達しつつありますが、静かな場所でひとりずつ話す環境に向いています。

ニュースの現場でその環境にあるのが、記者会見です。音声認識技術をテーマに記事を書こうと思い立ったそのころ、ちょうど安倍前首相が辞任を発表し、当時官房長官だった菅氏が自民党の総裁選に出馬表明していました。

新内閣発足といえば、レッドカーペットの階段での集合写真が印象的ですが、その後には官邸で閣僚の就任会見が行われます。

この時期の象徴的な会見のひとつとして、この就任会見をテーマにすることにしました。

この時、私は「少なくとも首相、官房長官+11省の大臣は調べよう」と考えていました。しかし、先に結果をお伝えしておくと、「首相、官房長官+6省の大臣」を調べ、記事にしています。

それはなぜか

「音声認識で文字起こしした文章の精度を調べる」ためには、まず元データとなる会見の「音声」と、その発言の「正解データ」が必要です。この場合正解としたのは、内閣府や各省庁が公開している「記者会見の発言要旨」でした。これと文字起こしした文章を照らし合わせて、「誤変換」があるかどうかを調べます。

もちろん政府の要人の発言なのだから、内容をネットで公開するのは当たり前だろう、となんとなく思っていたのですが、意外とそうではありませんでした。

新内閣発足日の記者会見は、官邸にて
①総理大臣
②官房長官
③各大臣

と続いていきます。これらの会見の様子は、政府インターネットテレビで後日、手話通訳つきの動画となって公開されています。これで「音声」は確認できることがわかります。

次に、発言要旨です。①総理大臣と②官房長官の発言要旨は、「首相官邸」のホームページにアップされます。

いきなり余談ですが、河野大臣も苦言を呈していたこの会見、ひとりずつ同じ会見場で行うので終わるころには深夜も深夜になります。一応会見の中継を見守りつつ、官房長官の動画が当日にアップされたのを確認すると、なぜかこんな文言が……。

【4時をめどに会見のテキスト版をアップする予定です。】

16日の夜にこれを見て、「いつの4時だろう…」と思い、その日は寝た私。しかし翌朝見るとすでにテキスト版がアップされていました。朝4時のことでした。

インターネットの向こうにいる誰かに思いを馳せて胸が痛みました。

(ただし、総理大臣の会見テキストとは異なり、官房長官会見は記者の質疑応答の内容はテキスト化されないようです……

省庁の大臣はどうだ

ここまでで、総理大臣と官房長官の会見は、発言要旨をネット上で確認できることがわかりました。では各省庁の大臣たちの発言はどうでしょう。

正解は、「官邸での」記者会見の発言要旨をHPで公開するかどうかは【省庁による】です。

たとえば今回法務大臣外務大臣に関しては、数日以内に発言要旨が各省のHPで公開されていました。一方で、それ以外の省に関しては掲載はありません。

図1

過去の記録を調べている時に、おぉ、どうしたもんだ、となったわけです。というか、「一律で決まっているものじゃない」ということに少しばかり衝撃を受けました。自分たちの省で行われる会見ではないから、ということなのでしょうか。これでは、法務大臣と外務大臣しか調べられないじゃないか。

ところがどっこい

しかし、「就任会見」というのは、「官邸」だけで行われるわけではありません。

各省の大臣たちは官邸での会見後、自分たちの省庁に戻るか、初登庁時などにも記者会見に臨みます。よし、それを調べたらいいじゃないか、と思いきや……。

図2

結果的に、開催日もバラバラでした……

発言内容から判断して、11省の中で、官邸での会見後に記者会見をしていたのは、法務省と防衛省。通常各省の会見は火曜と金曜の閣議後に行われているので、18日(金)の外務省、文科省、経産省、国交省では、再任というところもあってか、臨時会見はしなかったことになります。

ここにも落とし穴が

加えて、各省での会見を調べるとなるともうひとつ課題がありました。

必ずしも会見動画を公開しているとは限らないーー。

図3

「全員は無理ってことかァ……」と思わず空を仰ぎました。ちなみに、環境省が会見の動画をYouTubeで公開するようになったのは、小泉進次郎氏が大臣に就任してからのようです。

しかも、就任直後はシルバーウィークもあってか、動画や発言要旨のアップに10日以上要する省もありました。もちろん、休みを取るのは重要な権利なので、それについては何も言うことはありませんが、正直私は心臓がバクバクしていました……。

就任会見をテーマに、一般に公開されているデータから記事を書くと決めたからには、組閣からあまり時間が経たないうちに配信したい。だけどデータが出そろうまでには時間がかかる……。過去の会見の記録を見て、得られる情報はわかっていても、「それがいつ公開されるか」までは読み切れていませんでした。

ということで、
・就任後できるだけ早い段階の会見
・動画と発言要旨が両方ネットに公開される会見
・会見後、記事を配信するまで(8日以内)に公開されたもの
に限定すると調べられたのは、総務大臣、法務大臣、外務大臣、農林水産大臣、経済産業大臣、防衛大臣の6名のみとなってしまいました。

記者会見っておもしろい

いろいろアワアワした企画になりましたが、振り返ってみると、こんなに大臣の記者会見にかじりついて見たことはありませんでした。動画だけを見ていても、「ここの省は録画・録音設備が悪いな」とか、「この大臣は最初の『礼』が丁寧だな」とか、大臣と記者の独特の距離感とかも伝わってきて、一次情報だからこその情報の厚みみたいなものを感じます。

動画を公開していない省もありますし、直接私たちが質問できるわけではありませんが、「知る」ということについては開かれている場なのではないかと思います。ぜひ、機会があればYouTubeなどでも検索してみてください。

(ICTRAD・野口みな子)