iOSアプリ、音声ファイルもOpenAIで文字起こししてくれる「Aiko」

「アイコ」という響きを聴くと、
ついついドクター・ジョンの「アイコ アイコ」の楽曲が頭に浮かんできます。
人によってはカブトムシ?
あるいは視覚支援アプリのアイコサポートが思い浮かぶかもしれませんね。

ここ数年に渡り、ライブキャプション、自動字幕、文字起こしなど、音声を文字変換してくれる機能やサービスは数多く登場するようになってきました。
Aikoアプリの特長は、
・OpenAIのWhisper機能を利用
・マイクからの録音だけでなく音声・動画ファイルのインポートに対応
・デバイス内で作業
・無料

試しに「らくらじ2」アプリでダウンロードしたラジオ番組を文字起こししてみると、放送時間よりも長い作業時間だったかもしれませんが、句読点入りの日本語テキストが生成されました。
速度よりも制度を優先しているからのようです。

つづいて、WEBラジオマガジン「声のひろば」のmp3ファイルをダウンロードして試してみました。

令和4年11月・12月号 | 社会福祉法人 日本視覚障害者団体連合
視覚障害の6つの"壁"を溶かせ!「VISI-ONEアクセラレータープログラム」 (17分58秒)
http://nichimou.org/voice-cate/koehiror0401112/

晴眼者と書くべき箇所は「生願者」と変換されていましたが…
ははぁー、これはさすがにAIです。生の願いを届けようとする人たちという意味に拡大解釈して、このような漢字に変換したのでしょうね。

Aikoアプリのデフォルト設定のまま使ってみました。
言語は自動検出になっていますが、ちゃんと日本語を認識してくれます。
100の言語に対応しているようで、
タイ語、ハワイ語、ベトナム語、モンゴル語なども含まれています。

将来的には話者別に分けて表示してくれるようにもなる予定だとか。
音声ファイルをインポートすると、マイクで周囲の音を拾うわけではないので、にぎやかな環境でも作業が完了するのを待つだけです。

情報の多くは目から入ってくると言われています。
そのためでしょうが、視覚障害者向けのコンテンツの多くは耳から入るように作られています。
もし自分の聴力が落ちてしまうと入手できる情報量は激減するだろうなと、かなり気がかりです。
文字起こしアプリをいくつか使えるようになっておけば、そのような心配も少しは減ってくれるでしょうかねぇ。

とりあえず音声を文字起こしできるという利点は、
・キーワード検索できる
・外国語に翻訳できる
・点字で読める

いろいろと都合よいはず!

音声ファイルをテキストに、OpenAIのWhisper機能を利用して文字起こししてくれるアプリ「Aiko」 with iOS VoiceOver: Voice_of_i 見えなくても使えるiPhone
https://voicei.seesaa.net/article/499418083.html?1684578318

生活に欠かせなくなりそうなアプリです!