音声認識の差別、音のディープフェイクーー「音の社会問題」の最前線

放送の様子はこちら(下記サイトでは音声配信も行っています)。
「音声認識の差別、音のディープフェイクーー「音の社会問題」最前線」(Screenless Media Lab.ウィークリー・リポート)
2020.7/17 TBSラジオ『Session-22』OA

Screenless Media Lab.は、音声をコミュニケーションメディアとして捉え直すことを目的としています。今回は、音声に関する差別やディープフェイクなど、社会的に注目される問題・課題についてご紹介します。

◾スマートスピーカーに潜む差別的アルゴリズム

アメリカで生じたBlack Lives Matter運動は世界中に波及していますが、問題の根本は差別にありました。この差別は、技術が現存する差別をさらに助長してしまう側面があります。例えば監視カメラの顔認証システムが、白人に比べて黒人の認識精度が低いため、黒人は不当逮捕されやすいという問題があります。

音声に関しても同様の事例が報告されています。Apple、Amazon、Google、IBM、Microsoftの音声認識システムを利用したある実験では、全体平均で白人の声の誤認識割合が19%だったところ、黒人では35%となりました。各社のシステムで多少のばらつきはあるものの、白人に比べて黒人の声が誤認識されるという事実は、共通しています。この問題の原因は、顔認証システムと同じく、そもそもコンピュータが学習するデータに白人の声が多いことにあるとみられています。

◾アーティストの音楽を自動生成する技術

近年、特定の人物の顔部分を他人とすり替える「ディープフェイク」技術が問題になっていますが、音声の領域においても、一部でフェイクとも指摘される技術が生まれています。

イーロン・マスク(テスラモーターズCEO)も設立者の一人に名を連ねる「OpenAI」という研究組織が、2020年4月に音楽制作システム「Jukebox」を公開しました。Jukeboxは120万の楽曲(そのうち60万曲は英語)を細かく学習しており、歌手とジャンルを選択し、歌詞を入力するだけで、歌声まで自動で生成するものです。

OpenAIはサンプルとして、フランク・シナトラやエルヴィス・プレスリー、セリーヌ・ディオン、ケイティ・ペリー等が歌う曲を生成・公開しています。もちろん技術は完璧なものではありませんが、人々が驚くには十分なものでした。将来的に精度が今以上に向上すれば、この技術を用いればあるアーティストAの曲の歌詞を、別のアーティストBが、Bの曲調にアレンジ、つまりカバーしているように歌わせることが可能になるのです。

すでにAIが作曲家バッハのクラシック音楽を学習し、新しくバッハの音楽に似た曲を自動で生成する技術はありましたが、Jukeboxは歌詞を歌ったりと、より複雑な作業が可能になります。

合成音声においても、他人の声を勝手に利用して別のことを話させる、といったフェイク音声を指摘する声がありました。Jukeboxに対しては上記の問題に加えて、アーティストの音楽性をAIが勝手に利用するということ、それに伴う著作権の問題を指摘する声もあります。実際、一部ではJukeboxを音楽の「ディープフェイク」だ、という指摘もあるため、アーティストとその音楽というこれまでの概念に大きな影響をもたらし得ます。

音もまた社会的現象であり、様々な課題を抱えています。課題解決のためにも、音の観点から問題を捉える必要があります。

この記事が気に入ったらサポートをしてみませんか?