合成音声の実践的利用ーー「在宅ワークで使える音声技術」を考える

放送の様子はこちら(下記サイトでは音声配信も行っています)。
「合成音声の実践的利用~「在宅ワークで使える音声技術」を考える」(Screenless Media Lab.ウィークリー・リポート)
2020.4/10 TBSラジオ『Session-22』OA

Screenless Media Lab.は、音声をコミュニケーションメディアとして捉え直すことを目的としています。今回は、昨今の状況下で合成音声を用いるメリットについて、ご紹介します。

◾自分の声を合成する

新型コロナウイルスの影響で在宅時間が多くなり、オンラインでの打ち合わせなどが増えています。そのような中で、音声はどのような役割を担えるのでしょうか。

昨今の合成音声技術は、これまでも紹介してきたように、その精度を飛躍的に高めています。ただし、その影響はこれまで否定的に語られることも多くありました。実際あるイギリス企業のCEOは、人の声を少ないサンプルから合成する「ディープフェイク」音声を用いた電話によって騙され、約2600万円(22万ユーロ)を誤って送金してしまった事件もあります。

一方、「自分自身の声を合成する」技術は、使い方次第では非常に有用です。例えば、エイベックスと東芝デジタルソリューションズが共同で設立した「コエステ」社は、スマホアプリ「コエステーション」を発表しています。このアプリに自分の声を何度か録音していくと、自分にそっくりの声が作成されます。さらにこの「自分自身の合成音声」は、明るさや感情を変える等、声の調整も可能です。

他にも、2017年にカナダで設立された「ライアーバード(Lyrebird)」という企業は、わずか数分程度の人の声を学習して、合成音声を作成するサービスを展開しています。その声は、アクセントやトーン、イントネーションやリズムなど、かなり正確に再現ができるものです。

また、このライアーバード社を買収したアメリカの「デスクリプト社(Descript)」は、社名である「Descript」というポッドキャスト制作ソフトウェアに、ライアーバードの技術を利用しています。それによりコエステーション同様、自分の声の合成音声によるテキスト読み上げ機能を展開しています(Overdub機能)。

◾自分の声の合成音声が読み上げるメリット

在宅時間が増加する中で、自分の声の合成音声は様々に利用できると思われます。例えば自分の想いを伝えたり、あるいは音声を通じたつながりを目的として、音声配信サービスを利用し、自分の声を世界に発信しようとするユーザーもいるかもしれません。しかし最初から自分の声で話すことに抵抗がある場合、自分の声の合成音声を用いることで、音声をすべて(あるいは一部分を)読み上げさせることが可能です。また単に代読するだけでなく、自分で話す内容に間違いがあった場合の、撮り直しの手間なども省けるのです。

また大学やセミナーにおけるオンライン動画作成の場合も、撮り直しの手間を省くために合成音声が利用できます。他にもオンライン会議の際、家に家族がいて話しづらかったり、声を出すことが難しい環境にいる場合など、チャット機能でテキストを打ち込んだものを自分の声として発音させれば、自分で声を出さずとも、会議に積極的に参加することもできるでしょう。

合成音声の利用はこのように、様々なメリットがあります。とりわけ昨今の状況下では、合成音声が私たちにもたらす影響は多くあるように思われます。


この記事が気に入ったらサポートをしてみませんか?