スマートスピーカーの口調が変わるーー「2019年の音トピック」の最前線1

放送の様子はこちら(下記サイトでは音声配信も行っています)。
「スマートスピーカーの口調が変わる〜「2019年の音トピック」の最前線1」(Screenless Media Lab.ウィークリー・リポート) 2019.12/20 TBSラジオ『Session-22』OA

Screenless Media Labは、音声をコミュニケーションメディアとして捉え直すことを目的としています。今回は2019年の、音に関する様々な技術について紹介したいと思います。

◾文字起こしサービスの拡充

イベントやインタビューなど、音声情報の文字起こしにはこれまで、音声をききながらキーボードを叩くのが一般的でした。ところが最近は、自動で文字起こしをする手段が増えています。

iPhoneに音声を文字化する機能がありますが、googleにも「音声入力機能」があります。録音した音声をスピーカーなどで再生することで、コンピュータが音声を自動的に文字化してくれるのです。無料であることもあり完璧とは言い切れませんが、急ぎの文字起こしや内容の概要を掴みたいときなど、様々な場面で有効に機能します。

さらにgoogleには、現在は一部のスマホに提供が限定されているものの、「レコーダー」というアプリがあります。これは録音と同時にリアルタイム文字起こしをするものもあります(現在は英語のみ)。

こうした「音声入力機能」は、ユーザーが自ら語った内容が文字化されるため、キーボードを利用する時間を減らすことができます。またメールの返信など、自分の声を使って文章を「書く」ことが、ますます容易になってきています。精度も向上しているので、今後はキーボードとともに、「声で書く」ことが、一般的になるかもしれません。また声で書く文化が浸透すれば、新たな表現形式の誕生などが期待できます。

他にも「文字起こすくん」というサービスでは、LINEで友達登録をし、画像や音声、動画を送ることで、自動で内容を読み取って文字起こしをするものもあります(有料ですが、料金は格安です)。

◾スマートスピーカーの音声も進化

文字起こしに続いて、スマートスピーカー(AIスピーカー)の音声にも変化がありました。主にアメリカのユーザー向けではありますが、アマゾンは2019年12月、スマートスピーカー「アマゾン・エコー」に内蔵されているAIアシスタント「アレクサ」が感情のこもった対応を可能としました。具体的には、「うれしい、わくわく」や、「残念、同情する」といった感情を、弱中強の3つに調整できるようになりました。

この感情表現に用いられている合成音声技術によって、ユーザーが間違えた時には残念な声で、ユーザーがゲームに勝った場合などは、興奮気味に対応するとのことです。さらに、アレクサの口調に「ニュース」「音楽」のスタイルが加わりました(以前からアレクサには「ウィスパー・モード」など、いくつかのスタイルがありました)。

ニュースは重要な言葉のイントネーションを強調したり、音楽スタイルはスローでリラックスした口調になるとのことです。こうした機能によって、より親密に話したり、あるいは秘書のように適度な距離をもつなど、スマートスピーカーと人間の関係をより適切に調整することができます。

音声をもちいたサービスはますます進んでいます。次回も、音声にまつわる最新の情報を紹介したいと思います。

この記事が気に入ったらサポートをしてみませんか?