AI絵師の誕生とそれより前にAIが襲来していたボカロ界隈の話
はじめに
この記事は、いちボカロリスナーによる、「AIの襲来とそれによるボカロ界隈の現状」を踏まえてお絵描きAIとイラストレーターの今後をちょっと考えてみる記事です。
技術的なお話は最小限にとどめているため、技術に興味のあるエンジニアさん向けの記事ではありません。あらかじめご了承ください。
ここ数日、ツイッターとかで文章から絵を生成するAIの話題が良く流れてきます。
最初のうちは耳の早いエンジニアさんたちを中心に、これ面白いなと試行錯誤しながら画像を生成して投稿するお祭りだったと記憶しています。
しかしその後絵柄をまねて画像を生成してくれるAIサービスが始まったあたりから、何となくTLがきな臭くなっていった印象があります
ところで「VOCALOID」「VOICELOID」を筆頭とする「合成歌声」「合成音声」では、2019年にリリースされたNEUTORINOを皮切りにCeVIO AIやsynthV AI、VOICEVOXなど、ニューラルネットワークを用いた歌声合成・合成音声ソフトがリリースされています。
これらAI合成ソフトのうち、NEUTORINO(歌声合成)とVOICEVOX(音声合成)は無料ソフトであり、ブラウザ上で動くような手軽さこそないものの、話題のお絵描きAIと似たような分類をしてもよさそうな存在です。
これらのソフトが登場した結果、なにが起きたかを踏まえると、お絵描きAIと絵師の今後を予測する材料になるのではないでしょうか?
歌うAIの実力と人気
まずは「歌うAI」の実力と人気を見ていきましょう。
現在のところ「歌うAI」で一番有名なのは、Vtuber花譜さんの歌声を学習させたCeVIO AIのライブラリである可不でしょう。
ニコニコ動画ではすでに4000を超えるオリジナル曲が投稿されていて、YouTubeでも「キュートなカノジョ(syudou)」「フォニィ(ツミキ)」「きゅうくらりん(いよわ)」など1000万再生を超える人気曲が輩出されています。
ここまでの曲は音程などがかなり「ボカロっぽ」くて、その人間っぽさとか威力がわかりにくいかもしれません。
ので、人間の曲のカバーを紹介します。
かなり人間っぽい!
でもこれはあとから人間の手によって加工されているのでこのカバーを作られた方が作られた、ベタ打ち(音程と歌詞を入力しただけのもの)での歌唱も紹介します。
どことなくぎこちないですが、しゃくり上げやブレスはこの「ベタ打ち」の段階で自動的に挿入されています。ちょっとレコーディングの状態が良くない人間の歌唱で十分通りそう。
「歌うAI」が招いた議論
さて、この「歌うAI」が襲来したとき、現在ツイッターで巻き起こっているような議論をやはり呼びました。
先ほど紹介した「可不」は製作が発表されたとき、そのあまりにも本人(Vtuberの花譜さん)に似た歌声に、ファンを中心に戸惑いの声が上がり、「可不」の歌声をどの程度本人に近づけるかのアンケートが行われました。
アンケートの結果、結局のところ一番本人に近いtypeAが最多得票となりましたが、最終的には、花譜さん本人の意向を踏まえて中間のTypeBで商品化はなされました。
この時の様々な意見はくろ洲さんがまとめてくださっています。
また、サンプルもとになる歌手の不安は、「歌うAI」の前、ヤマハの「VOCALOID」の時代からあり、(こちらも先ほど紹介した)「IA」の中の人、Liaさんも当初不安だった旨を話していた過去があります。
IAは、育児休暇を迎えるLiaさんに対して、所属事務所社長の
という考えのもと開発されたのですが、これに対してLiaさんは以下のような不安を伝えていたようです。
なお現在は特段、自分の声に近しい合成音声が存在することに不安を覚えていらっしゃらない様子。
また、ボカロ界隈をはみ出したところでは、2019年にNHKとヤマハが制作した「AI 美空ひばり」は大きな議論を呼び、山下達郎さんが「冒涜だ」と非難しています
ただこの時は、どちらかといえばすでに亡くなった方をこのような形で再現することについての倫理の問題が大きかった印象があります。
実際、去年加山雄三さん本人が監修した「バーチャル若大将」(こちらは電通とCeVIOを開発したテクノスピーチ、coestationの制作)については特に議論はなかったように思います。
「歌うAI」の現実と歌手の関係
ここまで「歌うAI」の現在と、これまでに呼んだ議論について紹介しましたが、じゃあ結局のところこの「歌うAI」は人間の歌手の仕事を奪ったかといわれると…
いや全然奪ってないっす
初音ミクが登場した当時も人間の歌手の仕事奪うんじゃねとか言われて、でも全然そんなことにはならなくて、それが「胸熱」とかいうコピペ/ネットスラングにされたわけです。(胸熱の元ネタが初音ミクだと知らない人、結構いそうだよね)
なんならさっき可不の代表曲として紹介した曲のうち、キュートなカノジョを書いたsyudouさんは自身が歌唱するシンガーソングライターとして活動されてますし(しかも代表作はAdoさん歌唱のうっせぇわでしょう)、フォニィのツミキさんは女性シンガーのみきまりあさんとNOMELON NOLEMONというユニットを結成しています。
むしろ、ボカロPとして活動した人で、人間のシンガーを招く/自分で歌うなどしたアーティストのほうがボカロPのままより注目されている現状があります(これをボカロを踏み台にしていると揶揄する向きもあります)。
米津玄師/YOASOBI/ヨルシカ/Eve/須田景凪/キタニタツヤ/サイダーガール/ずっと真夜中でいいのに/etc…
さらに、前述の議論を呼んだ可不も結局ちゃんと受け入れられ、学習元となった花譜とデュエットしてたりします。
もちろん、先ほどあげたアーティストはAIシンガーが登場する前、前身である「波形合成」時代からの累積であり、AIシンガーがこれから急速に人間のシェアを奪っていくかもしれません…が、そんな予兆少しでもあります?
この現実を見ると、意外と人間は人間を求めていて、別に絵描きAIをそんな危険視する必要もない気がしています。
ちなみに合成音声のほうでは、coeFontというサービスが「吹き込んだ音声をもとに合成音声を作る」という今般特に大きな問題となっているサービスにどことなく似ているサービスを提供していますが……今吹き荒れている懸念はなかった記憶があります。(もちろん絵を取り込む労力と音声をとってきて流す労力はだいぶ違うことが前提としてありますが)
絵描きAIと歌うAIの違い
もちろん、絵描きAIと歌うAIの間には大きな違いがあります。
第一に、歌うAIは「AI学習に自分の声が使われること」に同意したシンガーの声のみを学習しています(いや実際には補完するためにほかのデータを取ってきてるかもだけど)。なので、今般の絵描きAIと違い「気が付いたら勝手にAIの肥やしにされてる」みたいな不快感は発生しません。
第二に、絵はこれまで「トレパク」「無断転載」などの脅威にさらされてきた歴史がある一方歌声にトレパクはないということです。
これはつまり、勝手にAIの肥やしにされることに対して敏感なりやすい土壌があるということです。
先ほど挙げたcoeFontに反発はなかったのにmimicに対して反発が強かった理由はこれでしょう。
つまり、「悪意ある誰かに勝手に自分の声を使われる」ことは想像しづらくても、「悪意ある誰かに勝手に自分の絵を使われる」のは現実的な脅威として想像しやすいということです。実際「AIの肥やし」には(たとえ法律上問題がなくても)勝手に使われた可能性があるわけで、ある意味当然の反発です。
第三に、音楽制作に関与する人よりも絵の制作に関係する人の方がツイッター上に多いということです。
これは単純に、ツイッターで炎上しやすいよねってことです。
こういった違いがある以上前段で述べた楽観論は安易に絵描きAIに適用するのも間違いだと思います。
おわりに
こうしてAI歌唱の歴史をまとめてみると、想像以上にインパクト小さかったなという印象を受けます。これはおそらく、「波形合成」の時代から続く「機械の歌声」の歴史の積み重ねがあるからでしょう。2007年に初音ミクが生まれてから、明日で15年です。この15年の間に社会に浸透した結果、AIシンガーが表れても「AI版初音ミク」以上の評価はなされなかったように感じます。
絵描きAIが今後どうなっていくかはわかりませんが、初音ミクみたいにキャラクター化して、まだ実用には不便なAIと過ごしていれば、いつの間にかいい感じに社会に浸透していくのかもしれません(誰か作ってくれないかな、絵描きAIちゃん)。
この記事が気に入ったらサポートをしてみませんか?