合成音声の未来ーー「人間を超える声」を考える

放送の様子はこちら(下記サイトでは音声配信も行っています)。
「合成音声の未来~『人間を超える声』を考える」(Screenless Media Lab.ウィークリー・リポート)
2020.4/24 TBSラジオ『Session-22』OA

Screenless Media Lab.は、音声をコミュニケーションメディアとして捉え直すことを目的としています。今回は合成音声の未来について考えたいと思います。

◾人間を超える「声」

前回の記事では、自分の声の合成音声技術によって、オンライン会議等の他にも様々な利用方法がある点について紹介しました。今回は、自分の声の合成音声だけでなく、広く合成音声技術の未来について考察したいと思います。

まず、以前紹介した歌声合成ソフト「ニュートリノ(NEUTRINO)」があります。ニュートリノによって生まれる歌声は、人間の歌声をデフォルメするようなこれまでの技術に比べて、より自然な人間の声に近くなっています。合成音声はすでに、自然な人間の声を再現することを、非常に高い精度で実現しているのです。

ニュートリノが歌声を学習するための歌声データベースを研究者に向けて制作した、音声情報処理が専門の森勢将雅氏は、興味深いことを述べています。森勢氏は、合成音声がすでに人間と変わらない、自然な声をつくりだせるだけでなく、「人間を超える声」の可能性についても言及しています。

例えば森勢氏は、いわゆる眠気を誘う声がある場合、そうした声を分析して眠気を誘う部分を抽出し、不眠症を緩和するための声が提供できるのではないか、と述べています。このような事ができるようになれば、そうした声を自分の好きな声優や俳優の声をベースに作成することも可能になるでしょう。好きな人の声を、眠気を誘う声にした上で、眠る直前に聞けるようになるかもしれません。

◾合成音声が日常になる世界

動画や写真の領域では、自分の姿を加工することはすでに一般的です。だとすれば同様に、声を加工することもまた、今後は一般化してもおかしくありません。

例えば、将来的に自分の声を一旦登録すると、授業や会議、プレゼンテーション等、状況に合わせて自分の声に一定の変化を加えられるような機能を、マイクに組み込んでおくことができるとしましょう。それはある意味で、自分の声に「化粧を施す」ようなものと言えるかもしれません。もちろんその声のベースは自分であり、それほどの違和感を感じることのないものでしょう。

こうした機能が用いられるようになるのはもう少し時間がかかるかもしれません。ですが、様々な活動がオンラインに移行している現在においては、合成音声技術によって業務負担を軽くしたり、自分の声の機能を従来のものより強化することも可能となるでしょう。その意味では、人間を超えるというより、人間が拡張されていくことになるとも考えられます(その是非は、今後より一層議論されていくことになるでしょう)。

もちろん再三指摘している通り、フェイク音声など、自分や他人の声を合成することによる犯罪等のネガティブな側面を、私たちは常に念頭に置かねばなりません。それでもなお、合成音声技術には多くの可能性があり、そのようなポジティブな側面の研究を推し進めていく必要もあるように思われます。

この記事が気に入ったらサポートをしてみませんか?