
記者会見の言葉を分析するための資料整理
昨日の記事では国会会議録を使って「注視」の発言者や経年変化を分析しました。
そこでも触れたのですが,記者会見の場で使うケースもけっこうあるように思えるので,それを使った分析をするにはどうすればいいか少し考えました。
大臣の記者会見
幸いにして各省庁の会見のページからテキストを取ることで,大臣であればデータが取れます。一覧にしておきます。
音声文字起こしの可能性
会見は「要旨」と書かれていますが,(確かめてないけど)おそらくほぼ全文書き起こしされています。しかし,内閣官房長官の会見は動画のみで全文書き起こしが見当たりません。
この場合,自力での書き起こしが必要です。実は就任会見を自動認識で書き起こししてみたというのは2020年に朝日新聞の方が記事にしています。
裏話もあります。
この記事はちょっとネガティブな感じでしたが,ここから3年経ち,もう少し精度が上がっているかもと思い,2023年12月11日の会見をWordのディクテーション機能を使い一部文字化してみました。

認識中に改行できないので読みづらい状態のままですし,多少の誤認識はありますが,だいぶ良さそうな印象です。これなら学生にアルバイトを頼んで校正してもらえば資料としてけっこう簡単に用意できるかもと期待できます。