Whisper Web や Adobe Premiere Pro で文字起こし

PLAUD NOTE というものを偶然知った。AI を使ったボイスレコーダーだ。

PLAUD NOTE ChatGPT連携AIボイスレコーダー|議事録を即時に作成|マクアケ - アタラシイものや体験の応援購入サービス
https://www.makuake.com/project/plaud_note/

簡単に録音ができ、AI を使った文字起こしや要約等ができてしまう。ガジェット好きとしてはすぐに買う気になった。

しかし冷静になって考えると、買うのは待った方がいいという気になってきた。

まず1ヶ月 10 時間までしか文字起こしや要約ができない。つまり、それを超えるとただのボイスレコーダーとしてしか使えない。

また1年がすぎると文字起こしや要約といった AI を使った機能はサブスクリプションに加入しなければいけない。文字起こしや要約をするために、年 6000 円で 50 時間か、月 1200 円で 10 時間のプランに加入することになる(時間数は文字起こしや要約ができる録音の長さ)。サブスクリプションに加入しなければ、これまたただのボイスレコーダーになってしまう。

ネットに上がっている情報ではメリットばかりが強調され、そのあたりをきちんと書いてない。

そもそも僕には文字起こしが必ずしも必要ではない・・。

これを機に、PLAUD NOTE を使わない文字起こしツールを探してみた。

ざっと調べた感じでは、リアルタイム文字起こしができたり、AI を使うような文字起こしや要約が付いているツールはサブスクリプションに加入するなりしてそれなりに料金がかかる。

僕は急ぎで文字起こしが必要ではないのでリアルタイム文字起こしは必要ないし、要約もいらない。だから、録音機で録音したものをあとでゆっくりツールに読み込んで文字起こしができたらいいな、という程度だ。

いくつか試してみて、まず良さそうだなと思ったのは Whisper Web だ。日本語にも対応し、そこそこの精度で文字起こしができた。アプリケーションをインストールしたりせず、ブラウザで完結するのもいい。会員登録なども不要だ。

Whisper Web - a Hugging Face Space by Xenova
https://huggingface.co/spaces/Xenova/whisper-web

ただし書き出したテキストにタイムコードが付与されない。文字起こしにも多少時間がかかった。ブラウザ上で文字起こしのテキストをクリックして該当箇所を再生するといったことはできない。

さらに使いやすいツールがあることに気付いた。それは Adobe Premiere Pro だ。僕は Adobe Creative Cloud に加入しているので Adobe Premiere Pro は使えるが、その文字起こし機能を使えばいい。

Adobe Premiere Pro の文字起こしは、動画ではなく音声ファイルだけを読み込んでも可能だった。しかも Whisper Web より速いし、書き出したテキストにタイムコードも付与できる(つまり他のアプリケーションに取り込んだりといった二次利用ができる)。文字起こしのテキストあるいは動画の再生位置のいずれかをクリックすることで、音声ファイルの再生位置および文字起こしテキストを同期して表示・再生ができる。

他の人と共有するには工夫が必要だが、少なくとも自分で文字起こしをさっと使うなら、Adobe Premiere Pro が追加料金なしで使えて自分には一番合っている。

PLAUD NOTE は買わずに済みそうだ。

参考:
「議事録作成にAIを使った自動文字起こしが便利すぎる!! なので操作をもっと簡単にしてみた」――急遽テレワークを導入した中小企業の顛末記(159)【テレワーク顛末記】 - INTERNET Watch
https://internet.watch.impress.co.jp/docs/column/teleworkstory/1534445.html


この記事が気に入ったらサポートをしてみませんか?