見出し画像

NEUTRINOがいつの間にか4周年 AIシンガー懐古厨

皆さんこんにちわ。くろ州です。↓これの人です。

↑これから4年たちました。今日はAIシンガーが一般人の手に落ちてくるまでの話を懐古していきます。

衝撃までの3年間

私が「AIシンガーすっっっっっっっご」と初めて感じたのは、今はなき「VoiceText」でした(今はブランド名が変わっている)。

すごい。しゃくりあげや声色の自然な変化。それまでもCeVIOがあったし、CeVIO登場時も「すごい自然な声だ!」って思った。それ以来の感動だったと思う。なお、DNN歌声合成みたいなデモ自体は名工大さんが16年末に出してたけど、そちらはしゃくりとか入れなかったはず。だからこのデモを聞いて私は「これほしい!」って思ったんだ。

その次に衝撃を受けたのは東北大ボイスメイドプロジェクトだった。これに関しては今もまだ「この音源売ってくれ」って思ってる。

これ、当時は研究室のHPにこっそり1番丸ごとの動画へのリンクが張られてて、私はこっそり保存して今も持ってる。これさぁ、同人歌手の人の声を学習させたらしくて、汎用性はなさそうなんだけどかなり魅力的じゃん。表現力豊かで、特に懐メロ好きにはドンピシャ。よすぎる。研究費の問題なのか結局その後リリースはされてない(はず)だけど、秘密裏にでも欲しい。

次はこれ。もう懐かしい。

りんなの音声はこれ以前もあるんだけど、現在の歌声合成AIの品質になってるデモ音声になったのはこの辺かなと思います。音外してるのがいいんだよな。

で、テクノスピーチさんがCeVIO AIにつながる音声を発表したのが2018年。

この音声、今聞いてもちょっと涙出る。テクノスピーチさんがこれを出してくれたことで「AIシンガーが製品になるんだ!」って期待値が一気に上がって、このころホントにずっとワクワクしてた。

この後出てきたのがヤマハさんのAI美空ひばり。

https://youtu.be/bOd9DOf516I?si=A-thIEOY1M-brtep

今聞くとすげぇ歌うまいなやっぱり。これに関しては倫理的な面でも話題になってたし、製品化はありえないと思ってたけど、とにかくヤマハが参入してきたってことがデカかったなと思う。

降りてきたAIシンガー

ここまでのAIは企業が独り占めしていて、技術者でもなんでもない、なんならAI美空ひばりより前は大学生でしかないくろ州には触れることすらかなわないものだった。拷問。

それがこの手に降りてきてくれたのがNEUTRINOだった。リリース少し前にデモ音声が出てたのを見て正直ドーパミン漬けになってた。そこから中の人を特定してアタックしてちょっと早く触らせてもらってAIシンガーきりたんの動画ができたんだ。

SSSさんと森勢先生が作ったDBからAIシンガーきりたんが生まれたんだって経緯は、もう知らない人もいるのかもしれない。偉いのはその人たち。

私は選曲とそこそこの調声テクとNEUTRINOの弱点を「息継ぎが必要な機械」みたいに書き換える演出力でサポートしただけ。それはそれですごいので褒めてほしいけども。偉いのはこれをちゃんと我々の元に降ろしてくれた神たちなんだ。

その後、AIシンガーはもういろんなところからあほほど出てる。

生成AIブームの走りだったかもしれないな

今は生成AIブームが爆上げ状態だけど、生成AIブームの最初は歌声合成だったと思うんだ。

イラスト生成AIで話題になった「Midjourney」が22年8月だったかな? StableDiffusionがそのちょっと後。ChatGPTは11月。SunoAIはかなり最近。

作曲AIとかは昔からあったけど、今みたいに「何もしなくても人間レベル」ではなかった。デモソングはだいたいAIが生成したものをベースに人間が仕上げたものだったし。

で、世間的にはおそらくGPT-3が出てきたときが最初の生成AIパンデミックだったと思う。あれは当時「危険だからモデルそのものは公開しないよ」ってOpenAIが言ってたくらいだった。実際すごかった。日本語でのデモが出てこなかったから日本ではIT界隈以外では話題になってなかった感じあったけど。

NEUTRINOはそれよりも半年近く前なんだ。すごくね? 歌声合成だから生成AIブームの最初として認めてもらうのは難しいだろうけど、私はあの辺が生成AIブームの走りだったと思ってる。


この記事が気に入ったらサポートをしてみませんか?