見出し画像

YYProbeに実装した「笑いが増える」音声認識技術の話(前編)

OSエンジニアの中村です。 今回は、前編・後編の2回にわたって、YYProbeでの笑い声の検出について話をしたいと思います。
 リアルタイム音声認識アプリYYProbeは、発言をテキストに変換するだけでなく、発言に含まれる笑い声や「あのー」「えー」といった言い淀み表現、咳、くしゃみ、性別、環境ノイズ音などの判定を行い、アプリの機能や音声認識精度の向上に役立てています。
 この中でも笑い声は判定した結果をYYProbeの中で表示していて、この機能は好評をいただいています。笑い声を可視化することが、笑いを誘うようで、会議の空気が明るくなることがあるようです。
 では実際のアプリの画面で、「笑い声」がどのように使われているか見てみます。

自分の笑い声を認識させる

 音声認識を開始した状態で実際に「笑う」だけです。設定は必要ありません。ただ、実際の笑い声を基に判定していますので、嘘っぽい笑い声は判定しないかもしれません……

画像1

同じ会議ルームにいる他の人の笑い声を認識させる

自分だけでなく、会議ルームに参加している全員の笑い声を可視化できます。

画像2

笑いを集計する

画面を右にスワイプ すると、集計結果にも笑いが反映されます。

画像3

言葉を図形にしてくれるワードクラウド機能。笑いが多いと中央に大きく表示されます。

画像4

笑いを可視化したいと思った理由

 僕が笑いを可視化したいと思った理由は、今後の高度化するAI社会では、個の感性から湧き出るユニークな感情を適切に表現し発信することが、新しい価値の創造につながると考えているためです。
 しかし、自分の感情を意図的に表現する人は少ないと感じていて、特に会社組織の中では、上司や部下に自分の感情を悟られないように抑える傾向が高くなると思います。
 そのような思いから、第一弾として、議事録に書き起こされることが少ない「笑い声」を文字化してみたのです。

 次回は笑い声の判定技術の概要を紹介したいと思います。

リアルタイム音声認識アプリYYProbe(Lite版)はこちらからダウンロードいただけます。無料でご利用いただけます。


この記事が気に入ったらサポートをしてみませんか?