見出し画像

フィラー・言い淀み除去機能が登場

会議やインタビューの録音をテキスト化する際、大きな課題となっていたのが、会話で無意識に出てしまう「えっと」や「あのー」といったフィラーや言い淀みの存在です。これらの不要な言葉が含まれることで、ノートの可読性が低下し、内容の把握が困難になるというユーザーの皆様からのご意見がたびたび寄せられていました。

この大きな課題となっていた『フィラー・言い淀みの除去機能』が、2024年2月29日にリリースされました。日本語に特化した汎用大規模言語モデル(RoBERTa)を活用して開発されたこの新機能により、録音された音声データからフィラー・言い淀みを自動的に識別し、除去することで、可読性を向上させることを実現しました。

この機能の開発にあたっては、フィラー・言い淀み以外の重要な単語が誤って削除されないよう、開発と評価を注意深く繰り返し行いました。その結果、安心して使用できる高精度のフィラー・言い淀み識別と除去が実現されました。

特に、「あの」や「その」のような指示代名詞としてもフィラーとしても機能する単語の扱いにおいて、文脈に応じた保持または除去を絶妙に判断できるように調整しました。

また、事前にフィラー・言い淀みが削除されることにより、録音されたテキストへの句読点付与の性能が向上しました。フィラー・言い淀みの除去だけではなく、句読点付与の性能向上により、ノートの全体的な読みやすさと理解のしやすさが一層高められています。

新機能で確認した具体例をご覧ください。

フィラー・言い淀み除去前の会話文例

えーっとー、テスト評価のためにですね、ちょっと、えっと、会議、議事録の、えーっと、2次議事録じゃないですね、会議の会話の、えっと、ちょっと評価をしたいってところで、えっとー、今、 こういう形で、えーと、録画とかしていますので、ちょっと、今週の、えっと、各種定例のところで、えっと、録画をする時があると思うんですけども、えっと、まあ、あの、

フィラー・言い淀み除去前

🔽🔽🔽🔽🔽🔽🔽🔽🔽🔽

フィラー・言い淀み除去後の会話文例

テスト評価のためにですね、ちょっと会議議事録の、2次議事録じゃないですね、会議の会話のちょっと評価をしたいってところで、今こういう形で録画とかしていますので、ちょっと今週の各種定例のところで録画をする時があると思うんですけども、

フィラー・言い淀み除去後

提示した具体例のように、フィラー・言い淀みを除去したテキストへ変換することにより、ノートの可読性が上がり、理解しやすくなっています。

ユーザーの皆様にも、新しく『フィラー・言い淀み除去機能』が実装されたCLOVA Noteで、ノートが格段に読みやすくなり、理解しやすくなっていることを実感していただけますと幸いです。

なお、この『フィラー・言い淀み除去機能』は新規作成ノートのにみ適用され、すでに作成済みのノートには適用されないことをご了承ください。
また、この機能は自動的に適用されており、アプリのアップデートは必要ありません。

これからも、より良い製品づくりのために、皆様のフィードバックをお待ちしております。(https://twitter.com/CLOVANote_JP)

▼CLOVA Note β のダウンロードはこちらから


この記事が気に入ったらサポートをしてみませんか?