音楽生成AIに、音声付きのチャットAIーー「音声における生成AI」最新情報

2023.5/26 TBSラジオ『荻上チキ・Session』OA

Screenless Media Lab.は、音声をコミュニケーションメディアとして捉え直すことを目的としています。今回は、音声に関わる生成AIの最新情報をお伝えします。

◾Googleが音楽生成AIを正式発表

当ラボで繰り返しお伝えしている音声領域の生成AIですが、まずGoogleが2023年5月11日、ついに音楽生成AI「MusicLM」を正式に公開しました。

MusicLMは2023年1月に発表されたものの、著作権侵害等の倫理面を考慮して一般発表はこれまでされていませんでした。ですが、プロのミュージシャンとのワークショップを行ったり、また生成される音楽が特定のアーティストの声や表現にならないように配慮したとのこと。これにより倫理面をクリアしたことで発表したとのことです。

MusicLMは28万時間の音楽データと、本物のミュージシャンによって記述された説明文を含む追加の音楽データでトレーニングされたAIであり、昨今の生成AIと同じく、文章で「ディナーパーティーにぴったりのソウルフルなジャズ」などの指示=プロンプトを打ち込むことで楽曲を生成します。楽曲は2つのバージョンが生成され、どちらがよかったかを選択することでAIのトレーニングにもなるとのことです。

googleは、初心者もプロもこのAIを活用することを期待していると考えています。今回は、googleのAIを利用したツールの実験場である「AI Test Kitchen」にて提供されていますが、利用枠が限られているため、原稿執筆時点では待機リストに登録する必要があります。実際に著作権侵害等の問題に抵触しないかどうかなど、MusicLMの今後にも注目が集まります。

◾AIチャットでも音声が登場

生成AIについては、やはりChatGPTが有名です。昨今はインフルエンサーがChatGPTで自らの人格を模したAIを作成し、一般ユーザーとそのAIが有料でチャットを行うサービスを開始するなど、様々な利用が伝えられています。ちなみに、そのAIチャットはインフルエンサー(女性)の声を合成音声化し、チャットは音声でも聞くことが可能です。英語の場合、合成音声であっても非常に精度が高く、聞いていて違和感もありません。このサービスは人気を博し、一週間の課金で7万1610ドル(約970万円)の利益となりました。

そんな中、あるソフトウェア開発者は、写真や音声も送ることのできる、AIチャット「GirlfriendGPT」の開発を進めていると表明しています。

GirlfriendGPTはメッセージアプリのテレグラムを通して行われるもので、AIの性格を好みのものに変化させたり、合成音声で有名な「ElevenLabs」の技術を利用してAIチャットの声を生成、自撮り画像もAIが生成してチャットで返すことが可能とのことです。

とはいえ、現在のところまだ開発段階で、どこまで利用可能なものになるかはわかりません。一方、こうしたサービスは様々に展開されており、規模の大きな企業だけでなく、少数のプログラマー集団や一人でも開発可能です。それだけ、昨今の生成AI技術が高性能になっていると考えられるでしょう。

ますます進むAIとのチャットサービスですが、AI相手だからこそ相手に酷い言葉を投げつけるといった事例も散見されます。AIだから何をしても良いわけではなく、今まさに社会で議論が進められているテーマでもあるでしょう。また合成音声についても、特定の人間の声をどこまで使用してよいかなども課題です。

AIとのチャットは他者にみせることのない個人的なものですが、であるが故に、都合のよいチャット相手というだけでなく、どのようなコミュニケーションを構築できるかが、ビジネスとしても、社会的な観点からも重要であるように思われます。


この記事が気に入ったらサポートをしてみませんか?