最近使い始めたディクテーションアプリ「CLOVA Note」がすごすぎる!
ライターにとってはインタビュー音声の「文字起こし」は、ホント悩みの種ですよね。
最近は文字起こしアプリ(以下ディクテーションアプリ)もたくさん出ていますが、いまいち精度が低い。AWSの有料のディクテーションサービスも、そんなに差はない。
かといって毎回専門業者に外注していたら雀の涙の原稿料なんて一気に吹き飛んでしまう。
だから1時間のインタビューを3〜4時間もかけてせっせせっせと半手作業で起こしているわけですが(ディクテーションアプリのおかげで随分楽にはなっているが)、今回、ちょっと決定版のようなものを見つけましたので、ご報告します。感動しすぎて、肝心の文字起こしを1時間も中断してこれを書いてしまったほどです(本末転倒!)。
それは、LINEが提供している「CLOVA Note」です。
もちろん知っている方は多いと思います。
私もとある先輩の編集者から教えてもらったのですが、いや、これ良いんですわ。
これまで僕は「UDトーク」というアプリが一番いいと思っていたのですが、それを遥かにしのぎます。
どれくらいすごいのか? まずは以下の比較を御覧ください。
>>>
(UDトーク)※現場で直接音声を採取
今こういうもので補うことができますし、やっぱり不安、あのちょうど例えば更年期の症状かなって思う方は、病院に変えるっていうことも、産婦人科医会ってことで、一つの解決方法かなと思うんですね。
(CLOVA Note)※録音した音声を変換
今、エコーのサプリメントっていうもので、補うこともできますし、やっぱり不安。あの、ちょうど例えば、更年期の症状もあるかなって思う方は、 あの病院に行かれるっていうことも、産婦人科に行かれるっていうことも、1つの解決方法かなと思うんですね。
(正解)
今エクオールのサプリメントっていうもので補うことができますし、やっぱり不安、あのちょうど例えば更年期の症状もあるかなって思う方は、あの病院に行かれるっていうことも、産婦人科に行かれるっていうことも、1つの解決方法かなと思うんですね。
<<<
どうですか? 「エクオール」という耳慣れない単語だけが間違っているくらいで、ほぼ100%じゃないですか? しかも現場でダイレクトに採取した音声ではなく、一回録音した音声をディクテーションさせてこの結果です。
それにしても、UDトークは変換に困った挙げ句「こういうもの」って、アバウトすぎるだろ!(笑)。これはこれで人間くさくて嫌いじゃないんだけど、やっぱりUDトークは、その名前の通り、視聴覚障害のある方や外国語の話者とリアルタイムでコミュニケーションをとるためのツールなのだと改めて実感しました。
さて、この「CLOVA Note」は、UI(ユーザーインターフェース)も非常に優れていて、アプリ画面上はご覧の通り、LINEのアプリでおなじみのキャラクターで話者を区別してくれます。
正直、話者の区別の精度はそんなに高くないのですが(実際このインタビューは2人でしたが、3人ということになっています)、発言の時間もちゃんと表示されていて、聞き直す時に便利です。
アプリ上で直接修正できますし、普通のテキストに変換もできますので、PC上で修正作業をすることも可能。
もちろん、録音した音声を聞くこともできます。
使用にあたっては、LINEのAIアシスタント「CLOVA」の音声認識の精度向上のために役立てられることを承諾するかどうかという局面がありますが、当然個人情報は配慮されるでしょうし、使えば使うほど精度が上がっていく分にはこちらもありがたい限り。もし気になるようでしたら、承諾しなくても利用はできます。
この辺は、Googleのディクテーションも同じだと思いますが、Googleドキュメントのディクテーションはインタビュー音声をその場で録音して音声認識させるには、かなり不便です(今は変わっているのかな。あるいは専用アプリがあれば教えてください)。
このCLOVA Noteは、オンライン限定(つまりインターネットに接続しないといけないので、Wi-Fiではなく4Gとかの場合、たまに電話がかかってきて困る場合はある笑)にはなりますが、現場でボイスレコーダーのように使えますし、その際の画面も、ちゃんとボイスレコーダーのようになっています。
UDトークの場合、リアルタイムで変換してしまうので、その画面をインタビュイーが気にしてしまうという弊害があります。レコーダーって話者の目の前にありますからね。
そもそもUDトークは録音しておいた別の音声をディクテーションするのは無理ですしね。しかも変換した文章はしばらくすると消えてしまう!なのですぐPCに共有しないといけない。そう考えると、やっぱりUDトークはディクテーションアプリとしては、ちょっと不便だったな(コミュニケーションアプリとしては本当に優秀だと思います。フリガナ付きとか、子供の言葉とかあって、ものすごくユニバーサルデザイン)
CLOVA Noteは、iOS・Androidどちらにも対応しており、PC用のアプリはありませんが、ブラウザでログインすることで、PC上の音声をアップロードして変換したり、修正したりできます。また、iCloudで連携しておけば、PCの音声ファイルを簡単にアプリにダウンロードしてくれます。
そして何より大きいのは、「無料」だということ。
オープンベータ期間中は毎月300分の利用時間が提供され、無料で利用できます。月間利用時間を使い切っても、スマートフォンアプリでは使い放題。なお、サービスの品質向上のためのユーザーデータ取得に同意同意すると、毎月300分が追加提供され、毎月合計600分を無料で利用できます。私は対外的なインタビューが多いので、守秘義務から同意はしていませんが、1時間のインタビューがせいぜい月に4本程度なので、60分×4本=240分と、なんとか収まります。
なお、録音は一度に最長180分まで可能で、べータサービス期間中はスマートフォンアプリで使い放題で変換できます。「音声変換には最大で24時間がかかる」とアナウンスがありますが、実感として1時間の音声で数分という感じで、AmazonのAWSより速いです。
という感じで、精度、使い勝手のよさで、ちょっと今のところ、CLOVA Noteしか勝たんという状況です。
なので、僕の文字起こしのオペレーションは、以下の通り劇的に変わりました。
(旧)
現場ではUDトークでディクテーション
現場でディクテーションできなかった場合は録音しておいた音声をAWS(有料)で変換
↓
(新)
両方、CLOVA note で対応。
よかったら試してみてください(LINEの回し者でもなんでもありませんが)。
公式サイトはこちら
https://clovanote.line.me/
以上、報告でした。
〆
この記事が気に入ったらサポートをしてみませんか?