見出し画像

インタビューの文字起こし、現時点での個人的最適解は CLOVA Note + ICレコーダー

前に「インタビュー記事を書くとき、文字起こしどうしてますか?」というタイトルで、音声入力に関する記事を書きました。

文字起こしにかかる時間をなんとか短縮したいと、いろいろな音声入力サービスやアプリを試してみて、現時点での個人的最適解と思われる方法をまとめました。
取材ライターの方、よく議事録などの文字起こしをする方の参考になれば幸いです。


最も使いやすかったのは CLOVA Note

前回の結果に加え、記事の最後に書いた知人オススメのサービス2つ

を試してみて、現在はICレコーダーで録音した音声データを、ブラウザから(Web版の)CLOVA Note にアップロードし、テキスト変換させる という組み合わせに落ち着きました。

CLOVA Note の特長・使い方

良いところ

  • テキスト変換の精度が高い

  • 書き出したテキストに適宜改行が入って読みやすい

  • 複数人の話し手を区別できる(話者分離)

  • 一度に180分までの音声データを変換可能

  • 音声データのアップロードは1か月に300分まで変換可能

  • 現時点では、スマートフォンアプリでは無制限に音声の変換が可能

  • 動作が安定している

  • 無料で使える

PCのブラウザでの編集画面。必ずしも正確ではないが、自動で話者を区別している。

音声入力の変換精度については、GoogleやMicrosoftの音声入力サービス、NottaやUDトークなどのアプリとも比較して、感覚的に最も精度が高かったのがCLOVA Noteでした。

スマートフォンのアプリを使えば音声変換の長さ(分)が無制限(ベータサービス期間中)でよいのですが、元の録音データが良ければ変換精度も上がるので、スマホではなくICレコーダーで録音することに。
記事の終わりに、私が使っているICレコーダーの機種を載せておきます。音量の平均化やノイズキャンセルなどの機能があり、良い音で録音できるのでやはり専用機はいいですね。

ちなみに、CLOVA Noteアプリを使った同時録音ではなく、iPhoneのボイスメモ機能を使って録音したファイルを別途アプリからアップロードする場合には、iCloud Driveに保存してあるか、またはiPhone本体に保存してある場合のみ可能とのことです。

<追記>
インタビュー中にスマホのアプリでリアルタイム変換をしていたこともあるのですが、途中でアプリが固まってしまうことがあり、それもICレコーダーで録音しようと決めた理由です。

音声データの対応データ形式

m4a・mp3・aac・amr・wavファイルに対応しています。

変換にかかる時間

約60分の録音データ(61.7 MBのmp3)をサイトにアップロードして、テキスト変換が完了するまでにだいたい1分弱でした。

文字起こしのダウンロード形式

テキスト形式だけでなく、Word、Excel、SRTファイル(字幕形式)に対応しています。

テキストファイル形式でダウンロードした内容

利用にはLINEアカウントが必要

CLOVA Noteは、LINE WORKSが提供するサービス・アプリですので、利用するにはLINEアカウントでのログインが必要です。

便利な機能

聞き直したい音声部分を簡単に指定できる

ノート画面で、音声記録の文字をクリックすると、その部分をピンポイントで再生することができ、確認に便利です。

ノートの共有も可能

私はまだ利用していませんが、ノートのリンクとパスワードを知らせることで、他の人とノートを共有することも可能になります。

単語登録もできる

よく使う単語をあらかじめ登録しておけば、さらに変換精度が上がるということです。
毎回話す内容が異なる取材やインタビューではこの機能はあまり使わないかもしれませんが、議事録の文字起こしなどには向いているのではないでしょうか。

ユーザーデータとして提供するかどうかの設定

ノート画面・左下の歯車アイコンから「サービス設定」に入ると、音声データや利用記録をCLOVA Note側に提供するかどうかの設定ができます。
許可するか、しないかを確認しておきましょう。

なぜUDトークを使わなくなったか

アプリの動作がときどき不安定

個人的にはUDトーク推しだったのですが、ICレコーダーを使い始める前、取材現場でUDトークのアプリを立ち上げて録音していると、30〜40分ほどでアプリが落ちてしまうことが数回ありました。
別の機種でも録音していたので難を逃れましたが、動作が安定していないのは困るので、今は使っていません。
(アプリの問題ではなく、スマートフォン側の処理能力不足や、通信環境が原因だった可能性も。またアプリのアップデートで改善しているかもしれません)
古くから、セミナーなどイベント時のリアルタイム文字変換などによく使われていますので、PC版だとまったく問題ないのかもしれません(イベントで動作が不安定なものは使わないはずですので)。また試してみようと思います。

変換精度はCLOVA Noteのほうが高かった

同じ録音データで比較してみたところ、UDトークよりも、CLOVA Noteのほうが正確に変換していることが多かったのです。

オススメのICレコーダー

OM-SYSTEM の WS-883 を使用しています。
(仕事を応援してくれている友人がプレゼントしてくれました。ありがとう!)

さすが専用機なので、

  • 自動で最適な録音レベルで記録する「ボイスチェイサー」

  • 遠くの声も聞きやすくする「ボイスバランサー」

  • 余分な雑音は抑える「ノイズキャンセル機能」

  • 「早聞き・遅聞き再生」

など機能が充実しています。

本体裏面のつまみをスライドしてUSB-A端子を出せば、PCにそのまま刺してデータのコピーなどができます。
電池は単4型の充電池2本が付属していて(WS-883)、USB端子をPCに刺すことで充電も可能。今後、接続端子がUSB-Cになるとさらに便利かもしれませんね。
882は乾電池が利用できます。

歩きながらの取材でぶら下げて録音していたら、ストラップが本体に当たってコツコツと雑音が入ってしまったので、ネオプレーン素材の専用ケースを買いました。これでコツコツ音もしないと思います。
少々高いのですが、マイク部分を塞がないぴったりサイズで、やはりこれしかないかなと思っています。

この記事が参加している募集

#ライターの仕事

7,327件

#仕事について話そう

109,816件

この記事が気に入ったらサポートをしてみませんか?