見出し画像

素起こし、ケバ取り、整文とは

会議やインタビューを録音した音声データ(動画データ)を、テキストにする作業を文字起こしといいます。
音声認識技術による自動文字起こしソフトもありますが、この記事では、人間の耳で音声を聞いて、それを手動でテキスト化する文字起こしについて解説します。

手動文字起こしにおける3つの起こし方

さて、人力による文字起こしですが、音声から文字にする際の起こし方には、それぞれの特徴によって3つの起こし方があります。
その3つとは、「素起こし」「ケバ取り」「整文」です。文字起こしの業者などでも、それぞれの呼び名は違っていても、だいたいこの3種類の起こし方を行っています。

素起こし

素起こしは、逐語記録、逐語起こしとも呼ばれますが、音声を聞こえたまま正確にテキスト化する起こし方になります。
研究・調査や、裁判の証拠として文字起こしを行う場合には、正確さが最優先されるため、この「素起こし」で文字起こしを行います。
正確なんだから、これが一番ちゃんとした起こし方なのかと思われがちですが、必ずしもそうとはいえません。その理由は、次の「ケバ取り」の項目を読まれるとわかります。

ケバ取り

人が話した言葉というのは、「あのー」「そのー」「えーと」など無駄な言葉や、言い間違え、言葉の噛み、言い直し、意味のない相槌など、不要な言葉が多く含まれています。
これらをそのままテキスト化すると、非常に読みづらい文章になってしまいます。そこで、こうした無駄の部分を取り除きながら、文字起こしを行います。この無駄な部分を「ケバ」と言い、これを取り除く作業を「ケバ取り」
と呼びます。

整文

録音内容によっては、ケバ取りをしても、まだまだ読みづらい文章であることも珍しくありません。
そこで、文字起こしした文章をさらに読みやすくすることがあります。この作業は「整文」と呼ばれます。
読みやすくなって結構じゃないかと思われるかもしれませんが、整文すればするほど、元の発言内容とはニュアンスが変わってきます。文字起こしを行う目的によっては、整文はむしろしないほうがよいこともあります。
また、文字起こしにプラスして整文まで行うと、トータルの作業時間がふえていくというデメリットもあります。

以上、文字起こしにおける3種類の起こし方について、ご説明いたしました。

この記事が気に入ったらサポートをしてみませんか?