音声合成・生成技術とその問題点【情報リテラシー論】

第12回情報リテラシー論のタイトルは「ラジオと音声技術の未来性」
授業の冒頭には、最新の音声合成技術についての紹介がありました。

この記事では、最新の技術を使ったサービスと、それらが普及する中で出てくる問題点について考えていきます。

 今年の9月ごろからchatGPTに音声入力と画像の読み込みという、「目」「耳」が搭載され、最新版ではノンストップで会話ができる機能もあるようです。

 それを知って、ぼんやりとAIが友人になる時代が来るのかなー、と考えていたのですが、なんともうそれを実現したサービスが始まっていました。

株式会社AI VOLTさんが10月14日(2023)からテスト公開したサービス「LINEドリームフレンド」。
 これまでロボットとチャットできるサービスはありましたが、このサービスはAIと通話できるものとなっています。会話する中で自分オリジナルにカスタマイズできるだけでなく、動画をアップロードして学習させることにより、好きな人の声で話してくれます。

調べながら、一人で寂しい時にはAIと会話してみるのもありだなと思ってしまいました。


問題点
 中国では早くからRVCなどで有名人の声を学習させたものが公開され、利用されてきました。

日本でもストリーマーのSHAKAさんの声でAIが歌う動画が拡散され、トレンド入りする、ということがありました。実際その動画を見たのですが、息継ぎや裏声など非常に再現性が高く本当に人が歌っているようでした。

魅力的である一方、声に関する権利が問題になっているのも事実です。

 声というのが定型のものではなく、その人の声を定義しにくいことや、日常会話のような音声は著作物と捉えにくいことなどが理由で権利を明確にするのが難しいようです。

 とはいえ、将来的には法整備がされていくのではないでしょうか。現在は使い放題のような状態ではありますが、可能な限り許可をとる、節度を持った使い方をするということは十分注意していきたいですね。

この記事が気に入ったらサポートをしてみませんか?