文字起こしが大変なので_自己流でなんとかしてみた

文字起こしが大変なので、自己流でなんとかしてみた

文字起こし(テープ起こし)ってすごく大変ですよね。「音声データを何度も聞き返しながら、WordやGoogleドキュメントを使って文章に起こして、テキストを整えて……」と想像以上の時間と労力を持っていかれる業務です。特に聞き取りにくい声の方や、めちゃくちゃ声の小さい方の文字起こしを終えた後は、達成感よりも脱力感がすごいです。

一時期、文字起こしばかりを続けていたとき「流石にこれは疲れる……」と思って自己流で編み出した「文字起こし」方法について共有したいと思います。文字起こしに疲れている皆さんの助けになれれば幸いです。


1. 「文字起こし」ってなにをしてるの?

さて、そんな文字起こしですが、実際にはどんな作業をしているかと言いますと、以下の様なことをしています。

素起こし:「あっ」「えー」などの間投詞や「正直言って」「ちょっと」などのくせ言葉といった清書の段階で削るべき言葉も残らず文字にする
ケバ取り:読む妨げとなるだけの言葉を削る
整文:書き言葉として読みやすくする
(引用)Wikipedia:テープ起こし

上記の通り、文字起こしって意外にやることが多いんですよね。ちなみに、私がこのなかで最も労力を削られるのが一番最初の「素起こし」です。音声データの質によって、このステップにかかる時間と労力が大幅に変動します。


2. 「素起こし」が大変な理由とは?

何故「素起こし」が大変かと言いますと、講演会やインタビューでお話をされる方は、文字起こしを前提に話をされない人がほとんどです。なので、普段お話をされる時と同じスピードで話されるので、文字に起こすときに「早い早い!書くのが追いつかない!」とよくなります。また、専門的な用語が多い音声データだと「え?今のなんて?」とその言葉がわかるまで何度も聞き返します。

なので「専門的なお話かつ、話し手が早口」とかだと30分の音声データを素起こしするのに最悪5、6時間かかったりします。ほぼ丸一日潰れちゃいますね。しかもこれは「素起こし」なので、ここから文章を整えていく作業が後ろに待っています。


3. 自己流文字起こし

さて、何度も文字起こしを続けてきて「こんなに時間かけられへんわ!」となった私が編み出したのが「Googleドキュメントの音声入力を使った文字起こし」です。簡単にいうと音声データを聞きつつ、自分で聞いた内容を声に出し、Googleドキュメントの音声入力に認識してもらう方法です。

他にももっと便利なやり方があるとは思う(それこそ音声データをパソコンに取り込んで、自動で音声入力してもらうなど)のですが、「録音機器が一定ではない」「音質の良し悪しの差がすごい」など、個々のデータでの落差が激しい場合が多いので「もう自分で喋るわい!!」と私はなりました。

まず、Googleドキュメントを起動します。(もしくはGoogleアカウントを取得してログインなど)そうすると、ツールバーに「ファイル」「編集」などが並んでいますが、その中でも「ツール」を選択します。

画像1

マイクのアイコンがついた「音声入力」をクリックすると以下のように表示されます。

画像2

この「マイクマーク」をクリックすると音声入力がスタートします。実際に、音声入力をしてみるとこんな感じです。

音声録音

録音を聴きながら喋るときはなるべくハキハキと喋ると良いと思います。あと、できれば個室の方が余分な音を拾わないのでおすすめです。


4. 最後に

自己流でなんとかしていた間に、AWSから文字起こしサービスが発表されましたね。まだ使ったことはないですが、噂で聞いたところ日本語は7割ほどの精度だそう。固有名詞の認識はやっぱり苦手なようですが、事前に登録しておけば反応してくれるらしいので、ちょっと試してみたいですね〜。


この記事が気に入ったらサポートをしてみませんか?