見出し画像

声×NFT 第34回「音声合成AIで遊んでみた」

こんにちは!NFTナレーターの松本ふみこです。
「声×NFT」というこのシリーズでは、まったくITの知識がなかった私が、NFTやメタバースなどのWeb3業界に飛び込んで、声の活動をどう活かしていけるのかを模索し発信しています。

ここ最近はAIの話題を取り上げることが多いですが、今回もやはりAIです。
しかも、私たちの仕事に大きくかかわる音声AIの話です。
といっても難しい話ではなく、楽しく遊べそうなアプリを見つけたのでご紹介したいと思います。
新しい発信の形やAIを使った作品の可能性について考えてみました。
NFTにも活用できそうなので、そのあたりも含めてご紹介します! 


AIショート動画生成アプリ「Kn1ght」

「Kn1ght(ナイト)」は、文字入力だけでアバターが話しだすSNS向けショート動画が生成アプリです。
様々な声の種類からベースを選び、さらに細かく調整する方法と、自分の声を録音して、その声を使う方法があります。
自分の声を使用する場合は、10秒間録音するだけで、自分の声でテキストメッセージを話すAIアバターを作成できます。
豊富なアバターから自分の分身となるキャラクターをカスタマイズしたり、オリジナルのキャラクターを作成したりもできます。
また、ヘア・服・目などの細かい調整も可能で、ジェスチャー付きエモートで感情を表現することもできます。
音楽を追加することもできるので、SNSの発信がこれひとつで完結します。


実際に触ってみて

Kn1ghtで作った作品をX(旧Twitter)でいくつか投稿してみました。
このアプリが凄いのは、生成する声のニュアンスや表現に、時に人間らしさが見え隠れする点です。
このアプリが人間らしく聞こえる要因の一つは、おそらく話すスピードの変化ではないかと思いました。
他のAI音声合成のように、一文字一文字が同じスピードではなく、時々変化する瞬間があります。
そのせいか、妙に人間らしい抑揚があるように聞こえます。
詳しいことはわかりませんが、従来の音声合成とAIの音声合成の違いなのかもしれません。
とても面白いなと感じました。

一方で、AIならではの独特な発音やアクセント、時にはなまった感じに聞こえることもありますが、それがかえって新鮮で、新しい楽しみ方を提供してくれます。

もう一つ面白いと感じたのは、生成するたびにしゃべり方が変わる点です。
同じテキストに対して何度も生成しなおすことができるのですが、
全部自分の声のはずなのに、声のトーンも微妙に変わります。
何が出てくるか分からないガチャ要素があるのも楽しみのひとつです。

ジェネラティブNFTとしての可能性

触っていて思ったのが、このガチャ要素を利用すれば、NFTのジェネラティブコレクションのようなものが作れるのではないかということです。
ジェネラティブコレクションとは、キャラクターのパーツなどをコンピュータープログラムでランダムに組み合わせて、多くの作品を作成するNFTコレクションのことです。
少しずつ違うデザインの作品を大量に販売することで、コレクター心をくすぐったり、同じコレクションの作品を持っている人同士のコミュニティができ、応援してもらいやすくなったりするというメリットがあります。

Kn1ghtは、アバターのパーツの組み合わせで様々なパターンを作ることができ、しゃべる音声も生成のたびに変化します。
同じキャラクターの作品でも、一つとして同じものがないデジタルコンテンツを生み出すことができます。
その特性を利用すれば、ジェネラティブNFTのようなものが作れるのではないかと考えました。
ここでのポイントは、AIによる「不完全さ」や「予測不可能さ」が、作品に独特の魅力を加えるという点にあります。
例えば、同じ文を読んでも、声のニュアンスが毎回異なるため、それぞれの作品にユニークな価値が生まれます。

商用利用について

気になるのは、商用利用可能なのかどうかという点ですが、確認しました。
Kn1ghtに元々用意されているカスタムアバターや自分のキャラを使用することができるオリジナルアバターであれば、商用利用が可能なので、NFTのような販売も可能だということです。
ただし、クリエイターが提供しているコラボアバターは商用利用できないのでご注意ください。

このような作品をNFTとして発行することで、創作者は自分の声とAIのコラボレーションによって生み出された独特のアートを、デジタル資産として所有し、販売することが可能になります。

朗読企画での体験

Kn1ghtを使って、声DAOという声のコミュニティで定期的に行っている朗読企画に参加しました。
この企画は、参加者が同じ題材の作品を思い思いの表現で読み、聞き比べて楽しむものです。以下の記事でもご紹介しています。

これまでは普通に読み上げる形で参加していましたが、このアプリでお話を読み上げたら面白いかも!という思い付きで、Kn1ghtを使って読んでみました。

その体験は、非常に興味深いものでした。
普段私たちが朗読やナレーションで表現するのは、人間特有の感情の豊かさや、文章や言葉一つ一つに込められた意味を伝えることです。
しかし、Kn1ghtを通じてAIが生成する声で朗読を行うと、期待とは異なる、AIならではの独特な表現に遭遇します。
声が本人に限りなく近く、妙に人間らしい抑揚もついていることから、まるで本当に人がしゃべっているように聞こえることもあれば、不意に現れるアクセントのずれや、読み間違い、不自然な表現が混じることもあります。
「そこでそんな言い方する?!」とつっこみたくなったり、思わず笑ってしまう場面もありました。

またこのアプリは、”だれでも簡単にVTuberになってショート動画を作れる”というコンセプトですので、音声だけでなく、視覚的に楽しめます。
アバターを動かしながらしゃべらせ、リアクションを付け、字幕を出し、背景を付け、音楽を乗せることができます。
ですから、動画をあらためて作成する必要がありません。
画像を読み込むこともできるので、物語の挿絵などがあればそれを背景にアバターをしゃべらせることも可能です。とても便利ですよね。

今回の試みで、AIと人間のコラボレーションがもたらす朗読の新たな表現の形や楽しみ方を発見しました。

まとめ

自分の声とは言え、音声合成アプリでナレーションや朗読を生成するなんて、ナレーターとしては邪道かもしれないし、一番大事なところをAIにさせてどうするの?という突っ込みも入りそうです。
しかし、新しいツールを触って遊んでみるのは大事だと思っています。
特に音声に関しては、私たちの仕事に直接かかわるツールです。
だからこそ、音声AIが今どのレベルまで来ているのか、自分はそれをどう活用していくのか、いかないのか、自分の立ち位置を確認するためにも、とても大事なことだと思っています。

AI音声合成は、声の仕事をする人間にとって脅威でもあります。
しかし、相手を知ることで、正しく恐れ、正しく活用していくことができれば、ナレーターや声優にとって武器にもなり得るのではないかと考えています。まだ漠然とではありますが、そんな気がしています。

今後も、音声AIも含め、新しいテクノロジーと声の活動について、発信していきたいと思っています。
みなさまの活動において、何かのヒントにしていただけたら幸いです。



今回の記事を気に入っていただけたら、スキやサポート(投げ銭)を頂けるとうれしいです。いただいたサポートは、今後の活動費として役立たせていただきます。


〇Xアカウント:@narratorfumiko
〇WEBサイト:フリーランスナレーター松本ふみこ
〇NFTコレクション:https://opensea.io/collection/ninjartcollection


この記事が気に入ったらサポートをしてみませんか?