見出し画像

インタビュー記事を書くとき、文字起こしどうしてますか? (音声入力は使えるのか)

編集会議でライター仲間が3人集まったので、ふと「インタビュー記事を書くときのやり方」について聞いてみたら、見事に三者三様で興味深かったのでまとめてみました。


文字起こしをするかどうか

そもそもインタビューを録音する/しないで分かれた

「インタビュー時の録音、全部文字起こししてる?」と聞いたところ、文字起こしをするのは3名中、自分を含めて2名。1名は録音はせずにその場でメモをするだけ、と分かれました。そうか、文字起こし云々の前に「録音しない」という人もいたのかと驚いています。すごい。

①インタビュー録音+手書きメモ

私はインタビュー時は録音させてもらい、その場では進行と会話だけに集中することにしています。長いインタビューが多いからという理由もあります。
事前に調べた内容と進行案をiPadで見ながらメモを取りますが、書くときのキーワードとなる印象的な言葉をメモするくらい(後述の録音で使う)。録音はあとからすべて聴き直して文字起こししています。
相手の語った言葉などの再現度が高い代わりに、書き上げるまでにかなり時間がかかります。文字起こしにかかる時間は、録音時間の2倍程度でしょうか。

②インタビュー録音+その場でノートPCにテキスト入力

録音をするもう1名は、録音はあくまでも補助で、インタビューしながらその場でノートパソコンに直接文章を打ち込んでいくというスタイル。そのほうが話の流れが見えて、進行もしやすく安心なのだと。「手書きメモを取るより打ち込んだほうが早いから」と言っていました。すごい。
入力できなかった部分だけあとから録音を聴き直すのだそうです。
私も入力は早いほうだと自負していますが、話をすることと入力すること、2つを同時にはできないシングルタスク人間なので、1つ(入力)は放棄しました。

③手書きメモのみ、録音はしない

「録音をしない」という1名は、メモと記憶だけで書くスタイル。
いわく、専門用語や技術用語などがたくさん出てくるインタビューや、自分の不得意分野のインタビューでは録音をするが、通常はキーワード程度のメモしか取らないと。こちらもすごい。
このスタイルは現場での集中力と記憶力の勝負になるので、かなり難易度が高い……。私は「自分は忘れてしまう」前提なので道具に頼ることにしています(録音もダブルで録っていることがあるくらいです)。

文字起こしに「音声入力」を使ってみた

上記のように私はインタビューの内容を一度文字起こししているので、これにかかる時間をなんとか短縮し、文章を作るほうに時間をかけたいなと常々考えていました。
そこで、いくつか無料で使える音声テキスト変換サービスを試してみました。
結果「ゆっくり、ハッキリ喋っている」録音以外はあまり使えないと思ったほうがよいという結論に至りました。

テストした音声テキスト変換サービス3つ

この3つを試してみて、一番使えるなと思ったのが「Azure AI スピーチスタジオ」。Windows + Edgeの組み合わせで使うのが安定していました(Mac + Chromeだと何度も途中で落ちました……)。

しかし、2時間くらいのインタビューを音声入力すると、改行もされていない1万文字強の文章が、ひどい誤変換やでたらめな文章を含めて延々と続くので、確認するのもかなり疲れます。
インタビュアーとインタビュイー、複数人の会話も区別してくれず、会話が被ればごっちゃになってひと続きでテキスト化されてしまいます(最近は話し手を区別できるサービスもあるようですが試せませんでした)。

今どきのAIを使えば革命的に楽な文字起こしができるかと期待していたのですが、残念ながらそこまでではありません。録音5本試して、音声入力のテキストだけで原稿のまとめまで使えたのは1本、これならもう録音を聴きながら手打ちしたほうが早いというものが半分でした。

次はGoogle Cloud Text-to-Speech AI を試してみようと思っています。

音声テキスト変換を使った文字起こしをChatGPTに読ませてみたが……

テキストの内容に留意しながら、音声テキスト変換を使った文字起こしの文章をChatGPT(無料版の3)に読み込ませ、まとめ直してもらおうと思いましたが、これも上手く行きませんでした。
しかも上手く行かないだけでなく、ChatGPTをかませることで、しれっと内容のねつ造が起きていることもあるので注意が必要です。

iPadとGoodNotesをインタビュー時に活用

最近、インタビュー取材ではiPadを活用しています。
iPadのノートアプリを使うと、事前の下調べのメモにリンクが張れ、写真なども貼り付けて、一元管理できて便利だからです。

さらに取材時には、そのノートに追加でメモを取りながら録音をします。
アプリはGoodNotesを使っています。
そのGoodNotesで便利なのが、メモを見ながら録音の頭出しができることです(アプリによりますが)。なので、頭出しを意識してメモをしておくと、あとから聴き直しがしやすくなります。

一つだけ問題があるとすれば、GoodNotesで録音したものは音声データとして取り出せないことです。
Azure AI スピーチスタジオは音声データのドラッグ&ドロップで自動で文字起こしをしてくれるのですが、音声ファイルが取り出せない場合や、ほかの音声入力サービスを使う場合には、ノートPCの前でiPadの録音を再生するというなんとなく昭和的なスタイルになります。

文字起こしから原稿にまとめるまで

文字起こしから原稿にまとめるまでには、だいたい3〜4段階で進めています。

  1. 全体の文字起こし(音声入力そのままレベル)

  2. 文章のまとまりに見出しを付け、不要な部分を削除
    (手打ちの文字起こしだと1と2のあいだくらいからスタート)

  3. 構成に沿って抽出・並べ替え
    (記事の構成に沿って、必要な部分をざっくり抽出しながら、話の流れに応じてそれらを並べ替えていき、話し言葉を直すなど整理していく)

  4. 原稿(ひたすら文章を削り、まとめていく)

インタビュー時に話してもらった順番通りに書くことはほとんどありません。話の内容によって組み換えたり、並べ替えたりして、記事全体で話の流れがスムーズに整うようにしています。

何段階にも分けて削ったり並べ替えたりして時間がかかりすぎているようにも思うのですが、結局はこれが自分の中では早いのではないかと、そう考えています。

追記:その他の音声テキスト変換サービス

知人からオススメの音声テキスト変換サービスを教えてもらったので、共有します。

今度、どのサービスが賢く変換できるか、同じ音源を使って試してみたくなりました。

追記:その後、文字起こしの個人的最適解をまとめ直しました

その後、上記「CLOVA Note」「UDトーク」を試してみて、2024年2月現在の、文字起こしに関する個人的最適解を記事にまとめ直しました。
今は、Clova Note + ICレコーダーの組み合わせで文字起こしをしています。変換精度も高く、便利です。
詳細は以下の記事をご覧ください。


この記事が参加している募集

#ライターの仕事

7,377件

#AIとやってみた

27,805件

この記事が気に入ったらサポートをしてみませんか?