見出し画像

ライターさんに聴いたCLOVA Noteの使い方 後編

前回に引き続き、実際にCLOVA Noteを使って、フリーライターの谷川耕一さんにCLOVA Noteの使用感とライティングの今後についてお伺いしました。

後編ではCLOVA Noteにほしい機能、またはこんな機能あったらどうでしょう?という質問にお答えいただきました。

前編中編はこちら

文字起こしアプリCLOVA Noteの詳細はこちら

谷川耕一( @ktanikaw
エンタープライズITのフリーランスジャーナリスト、ブロガー。翔泳社EnterpriseZine DB Onliieチーフキュレーターとして、また環境系の話題にも注目されながら活動されています。
谷川さんは主にブラウザ版のCLOVA Noteを活用されているとのことですので、実際のお仕事の進め方と併せてその活用方法をお伺いします。

谷川:視点が全然違いますけど。日本語の文章の中で、ITの業界って、英語や略称がいっぱい混ざるじゃないですか。 なので、テキスト化した後にカタカナ変換したところだけを抽出して、一覧にしてくれるとかっていうのもあるといいなって気がします。

インタビュアー:ITあるあるですね。変換のときは一旦カタカナで表記されてしまうけれど正規表現は英語表記みたいなのはたくさんあるので、そのあたりの一括変換みたいなのがあると便利ですね。

谷川:そうですね。我々が使う単語はだんだん決まってくるし、その時々の流行はあるんで、その辺が簡単に食わせられるといいのは確かにそうです。例えばカタカナで表記されたものがリストになって、希望的に言えばそれに対応するアルファベット表記も横にサジェストされて、CLOVA Noteを使ってる側が合ってる、合ってないって学習させてあげられるとか。

どんどんそうやって機能を付加はできるのかなという気はしますけど、どこまでCLOVA Noteでやれるようにするのかはまた考えようなのかなって気はしますけどね。

インタビュアー:谷川さんも存知のように、CLOVA Noteって、End to Endというディープラーニングの手法を使っているので専門辞書みたいなものを学習させづらい構造にはなっています。そこをどうクリアするかっていうのを今一生懸命考えているようです。

谷川:本来自分で辞書登録なんかしたくないから、ある分野の単語を学習したら、その領域に強い変換してくれるのがいいんだと思いますけどね。

とはいえ結局喋り手側がそれをどう表現するかなので、辞書を入れても音声のテキスト化のときにマッチしない傾向ってたくさん出てくると思います。だからその辺は辞書よりは勝手にその分野に強い機械学習してくれた方がいいのかなって気はしますね。

インタビュアー:基本的に辞書だけ入れても、すぐには学習できないので、その音声を聞いて、それはもうこの専門用語だよって、教えていかないといけないですね。AIあるあるなんですけど、そこって人間による人海戦術が大事になってくる。

CLOVA Noteのエンジンは、自己学習機能がついているので1回ある程度のところまで教師あり学習をさせると、あとは自己学習機能に切り替わっていくんですね。
そこがすごく優れてるところで、精度が高いのはそのお陰という部分もあるんですけど、種は与えないとそれが動かない。

話は変わりますが、現状CLOVA Noteは動画ファイルの読み込みができなかったり、Zoom連携とかがないんですが、そのあたりの需要はやっぱりありますか?

谷川:僕はMacを使っているので、録画したものから音声抜き出すのって別にそんなに難しくないんですよ。Macだと選択したオーディオファイルを右クリックしたら「エンコードする」って機能があるので特に困ってないですね。

Zoomの連携もどう連携するかにもよりますけどただ動画を読み込めるってだけだったら意味ないのかなって。

会議アプリ系でプラグイン的なことがきるんであれば、会議が終わったら、その瞬間にテキストが表示されるとかだったらありかもしれないけれど、だったら会議アプリ側でやればいいじゃんって思います。

インタビュアー:要約機能とかはどうでしょう?

谷川:要約でうまくいってるの見たことないんで、難しいんじゃないかと思いますけど。

インタビュアー:そうですね。実験はしてみるみたいなんですけど、議長さんというか司会がいて、定型的な会議だったらそれなりにできても、ディスカッション系だとどこか大事かがわからないっていう難しさはあるみたいですね。

谷川:例えば英語とかでテキスト越したら1万字だったものを千字にしますよ。っていうような要約だったら、あまり必要とされないのかなって気はします。全体に対してキーワードを抜き出すとか、過剰書きにできるようなことが見つかったとか、そういうちょっと違う形だったら意味がありそうな気はしますけど。

インタビュアー:最後にお伺いしたいのですが、谷川さんの周りのライターさんってCLOVA Noteにに限らず、音声認識って使い始めていますか?

谷川:冒頭でいったように録音をして必ず書き起こすからメモをとらないっていう人と、録音は一応するけどメモを中心にテキスト化していく人と2種類のタイプがいると思うんです。で、必ず書き起こすっていう人は何かしら音声認識を使っていて、制度が上がって使いやすくなることはすごい求めてるし、課金してでも使ってるって人も何人もいます。

僕はどっちかって言うとメモ中心派で、録音はするけど、ほとんど聞かないってタイプでした。 でもセミナー系は聞きながらメモするって結構苦痛なんですよ。

インタビューはやり取りなんでメモ取りながら聞く、ができるんですが、向こうが一方的に喋ってるのをひたすらメモするのは別の作業って感じがするので多分これからはCLOVA Noteでテキスト化するってやり方が主流になると思います。

インタビュアー:ありがとうございました!貴重なご意見もお伺いできたので、開発サイドへのフィードバックの参考にもさせていただきたいと思います。

CLOVA Noteでは、実際にアプリをお使いいただいてる皆さんにも使用感やご要望についてお伺いしたいと考えています。インタビューにご参加いただける方も募集していますのでCLOVA Noteをすでにお使いいただいてる方はぜひ、ハッシュタグ #CLOVANote 、または公式Twitter アカウント @CLOVANote_JP までお知らせください!

文字起こしアプリCLOVA Noteの詳細はこちら


この記事が気に入ったらサポートをしてみませんか?