見出し画像

【AI×UIUXデザイナー】音声の文字起こしは可能か?#1RIMO

こんにちは、ジャスミンです。
久しぶりにデザイン熱に火がつきました。それは新しい働き方、AIをパートナーとして仕事をすることです。

AIと一緒に働く
UIUXデザインの中で発生する業務をAIにサポートできるのか?実験を始めます

第1弾。音声を文字に変換できるか?

第一弾として音声を文字に変換できるか?について実験を始めます

ユーザーインタビューや、クライアントとのMTGで音声を録音し、文字起こしをしたい状況はありませんか?

自分でやると時間がかかりますし、特に専門的な分野の場合は聞き慣れない言葉を理解すること自体が難しく、入力に手間どいます。

そこでAIに自動化をお願いしてしましましょう。

調べてみたところ、いくつかのサービスがすでにある事がわかりました。

今回はその中の一つを使ってみてのレビューです。

RIMOを使ってみる

#1はRIMOの無料体験を使って実験してみます

音声データの状況は以下です

・1時間の会議
・発話者が4人以上
・特定の業界の専門用語を多く使って話されている
・日本語

レビュー

時間 ★★★

書き起こしまで
1時間の音声データをアップロードして、テキスト変換までにかかった時間は5分

言葉の精度 ★★★

日本語として違和感のある表記が少ない。
一部、専門用語に関しては漢字の表記がおかしいところはあるが前後の文脈はわかるので、すぐに修正ができる

操作のしやすさ ★★★

音声データをアップロードする、文字情報を見る、独自の機能を見つけて編集してみる
これらがすごく簡単にできて、ほとんど分からない事がありませんでした。

機能

要約をAIが自動で表示してくれる(要約だけのシェアも可能)
・話者によって自動で分離してくれるシステムがある
・テキスト情報を押すと、そこの音声も同時に流れる。ハイライトされるので便利
→これはやり方を見ましたがうまくできず・・
・共有サービスあり(ログインしなくても見れる)
・その他以下のようなものもあります

価格

法人

個人
30秒30円

まとめ

経済的に余裕のある企業や、重要な会議、ユーザーインタビューなど音声内容が非常に重要なシーンでの利用がおすすめ!

日本語に特化して開発されただけあり、言葉を認識する精度が高いように思えました。ただし、当たり前ですがその分価格が高い。

価格を気にしなくて良い場合は、すぐにでも導入したいと思えるサービスです。

今回のように議事録レベルの会話を書き起こしたい場合は、ここまでの精度はもったいなく、コストもかけられないので難しいと思いました。

引き続き、調査を進めます・・!



この記事が参加している募集

この記事が気に入ったらサポートをしてみませんか?