ポッドキャスト音声もAIによる吹き替えが可能にーー「ボイス・トランスレーション機能」の可能性と課題について考える

2023.10/20 TBSラジオ『荻上チキ・Session』OA

Screenless Media Lab.は、音声をコミュニケーションメディアとして捉え直すことを目的としています。今回は、音声クローンの問題点や、Spotifyが発表した新たな吹き替え機能について紹介します。

◾音声クローンによるサービスの問題点とは

昨今は合成音声による読み上げだけでなく、「音声クローン」と呼ばれる、自分や有名人の声のサンプルをAIに学習させることで、オリジナルの声に酷似した音声クローン技術が注目を浴びています。すでに当ラボも何度も言及していますが、新たな動きも出てきました。

まず、アーティストの歌声をAIに学習させることで、「歌声のクローン」を作成するAI音声サービスが存在します(Voicify AI)。このサービスは、自分だけでなくアーティストやアニメのキャラなど、様々な声や歌声を学習させ、YouTubeの動画で歌われている歌の、歌声だけを別人のAI音声に変換すること等が可能です。また、最初からアリアナ・グランデやテイラー・スウィフトといった有名アーティストの音声モデルを有しています。

このサービスはユニークではありますが、アメリカレコード協会(RIAA)は、著作権侵害を誘発するおそれがあると考えています。そこで同協会はアメリカ政府に対して、このサービスを「著作権侵害監視リスト」に含めることを要求しました。

こうした問題は、2023年に入ってから頻発しているものです。2023年4月には、ドレイクとザ・ウィークエンドのAI音声クローンによって制作された楽曲がSNSや音楽ストリーミングサービスで数多く再生されたため、音楽レーベルから削除要請があったのは記憶に新しいものです。

アーティストのグライムスのように、自分のAI音声について自由に使うことを容認するアーティストもいますが、YouTubeも2023年8月、アーティストの権利を保護しつつ新たな表現を強化するために、音楽レーベルや関係者と共にこの問題を考える方針を発表しています(YouTube Music AI Incubator発足についての発表)。

◾Spotifyによる多言語音声吹き替え機能の発表

他方、AIによる音声読み上げ、音声翻訳(吹き替え)技術は飛躍的に発展し、2024年にはYouTubeが音声のAIによる吹き替え機能を搭載すると発表したことは、以前もお伝えしました。

この流れの中、Spotifyも独自のサービスを発表しました。Spotifyは2023年9月25日、生成AIを利用し、ポッドキャストのMCの声を複数の言語に吹き替える「Voice Translation」という機能を発表しました。

この技術には、ChatGPTの開発元であるOpenAIの新たな音声技術と、文字起こしツール「Whisper」を利用するとのことです。特にこの音声技術は、数秒の人の声から、リアルな合成音声の作成が可能ということです。また、従来よりも自然なサウンドで、話者の特徴的な話し方を維持したまま、その声を別の言語に吹き替え可能ということです。

同日の発表ではパイロット版として、英語からスペイン語に吹き替え(音声翻訳)した音源が公開されています。Spotifyによれば、フランス語吹き替えとドイツ語吹き替えを、数週間のうちに発表するとしています。

この機能に関して、現状は日本語については言及されていません。ですが、順次日本語を含め、世界中の言語に対応が可能になると思われます。そうなれば、ポッドキャストをはじめ、日本語で話した内容が、世界中の人に、その国・地域の言語で届けることが可能になります。YouTubeでも同様ですが、いわゆる「外国語の壁」あるいは「日本語の壁」が取り払われることで、私たちはより多くの情報発信・情報収集が可能になるように思われます。

さらに言えば、ラジオをはじめとした音声サービス、あるいはテレビ等の動画についても、多言語での発信が可能になれば、災害時などの情報発信などにも有効でしょう。無論、翻訳には誤訳や誤情報発信の危険性があり、そうした問題は別途考えていく必要があるでしょう。

とはいえ、言語の壁の高さが低くなっていくことは確実であり、私たちはより多くの情報に触れることが可能になります。その際、グローバルなレベルで何が生じていくのか。少し先の、しかしそう遠くない未来のあり方について、考えていく必要があるでしょう。

この記事が気に入ったらサポートをしてみませんか?