見出し画像

AI歌声合成4つ 特徴まとめ

 今回は充実してきた感のある、人間らしさを表現しやすいAI歌声合成についての紹介・まとめです。個人的な感想とそれぞれざっくりとした特徴ですが、選択の参考になれたら幸いです。

エディタとライブラリ

 一般的な音声合成ソフトは最終的な波形データの書き出しや編集を行う「エディタ(本体)」と、それぞれのキャラクターの「ライブラリ」という構成からなるものが多いです。このnoteでは基本的にはエディタとライブラリという表記をしますが、製品それぞれで表記が変わっています。

それぞれの特徴と傾向

Synthesizer V Studio

(ライブラリ=歌声データベース)
今一番勢いがあると思われる、表現力・自然さはピカイチ
パラメータ多いので最初は沼ること間違いなし、歌い直すような感覚で使えるリテイク機能というものもある。
無料でエディタがBasic、音声DB Lite版であれば利用・発表も条件付きで可能
エディタとライブラリが別売り。
VSTとして利用したいなら最上位のPro版がベスト(DAW上で作業が完結するのは便利)。
ライブラリはキャラクターによってAI版とそうでないのがあるが、人間らしさを求めるなら普通にAIでいいと思う。メインパートをAI、ハモりを通常とかすると雰囲気変わるのでいいかもしれない。

よく使いそうな機能まとめ(くろ州さんのサイト)

CeVIO AI

(ライブラリ=ソングボイス)
商用のAIエンジンの先駆け 体験版等は無い。
人気ある音楽的同位体シリーズはこれ、さらにキズナアイを基にした#kznもある。
エディタとライブラリ別売り、ライブラリが結構豊富。読み上げと歌が別なので購入時注意。
エディタはスタンドアロン動作のみ。ただしオケ音源を読み込ませて同時再生はできるみたい。
ややボカロみたいな機械っぽさがある、が、そこから自分の色を出しやすい余地があるかもしれない。
(2023/02/26追記 3年近くNEUTRINOばっかりを使ってきて、CeVIO AI のライブラリは東北きりたんと可不だけ持っている上での印象です)

互助会WIKIも要チェック

調声基本

調声応用

各ボイスの特徴


VoiSona

(ライブラリ=アーティスト(Webでの表記)・ボイスライブラリ(利用規約での表記))
旧名CeVIO AI Pro なのでCeVIO AIの延長上にあるような立ち位置かもしれない。そのためかCeVIO互助会WIKIにも少し情報がある。ライブラリはこれから充実していきそう。
エディタ本体と「知声」は無料で使用可能。
知声特徴的な声質ながらメイン・コーラスどちらでもいける器用さがあると思う。
エディタはVSTプラグインとして動作する。
ライブラリは基本的にサブスクで出す方針のよう。
合成音声としては珍しく暑苦しい男声(機流音=鬼龍院翔 ゴールデンボンバー)がある。
ひょっとして今後キャラの濃い音声ライブラリもラインナップしたいとか考えている?
商用利用OK

NEUTRINO

(ライブラリ=歌声ライブラリ)
2020年2月に登場、いわゆる「AIきりたん」の自然で人間的な歌声が各界に与えた衝撃は大きい。いまだ後発に負けない独自の強みがあると思う(出力される波形はマイクで録ったような扱い勝手の良さ)。
基本的に無料、エンジンはWin、Mac、Linuxで動作するが、エディタはWindowsのみ。
合成に時間がかかる。他のエンジンは空き時間に波形をレンダリングしているのに対し、こちらは都度開始しなければならない。なので、1曲まるまるの歌声波形をつくるのでなく、小分けにして作ることが推奨されている。大体8小節ぐらいとかがいいかも。
商用利用(そもそも利用規約が)はライブラリごとに違うので要確認。

Synthsizer V CeVIO AIを購入するならお得に

 Synthsizer V と CeVIO AIはエディタとライブラリが別売りですが、ともにスターターパックというエディタとライブラリが一緒になったものがあり、それぞれバラで買うよりも若干安い値付けとなっています。
 販売形態としてパッケージ、ダウンロード版とありますが、Amazon、SoundHouse、DLsite等で買えます。最寄りのリアル楽器屋さんにもパッケージならあるかもしれません。
 DLsiteでは不定期にセールしていたり、クーポン配布しているタイミングに合えば安く買えます。特にクーポンは稀に60%引きとかあるようです(そのタイミングで15%OFFを引いた人は私です)。
DLsite

商用利用について

 それぞれの利用規約をざっくりみていったところ、商用の解釈がそれぞれ違っていて、個人(同人サークル)でも金銭の授受が発生するなら商用としていたり、逆に商用は原則要許可かNGとしていながら、法人でなく個人レベルなら商用と見なさないなど、それぞれに違いがありました。CD化、あるいはダウンロード販売する予定ならば購入前に要チェックです。

NEUTRINOとCeVIO AIの東北姉妹シリーズ

 東北きりたん、東北ずん子、東北イタコはNEUTRINO(無料)とCeVIO AIそれぞれにライブラリがある。出力結果は全然違う。忖度なしに言うと有料だからとCeVIO AIがいいかというとそうでもない。が、NEUTRINOはあまりきめ細かな調声が出来ないのに比べ、CeVIO AIではできることは多い。
 NEUTRINOは制作時に試聴まで時間がかかってしまうので、私の場合はCeVIO AIで譜割りを確認してからMusicXMLを書き出して、NEUTRINO調声ツールで合成しています。CeVIO AIの書き出すファイルはxmlですがそのまま調声ツールにD&Dで読み込み可能で、テンポ・キー情報も維持されます。

CeVIO AI ・VoiSonaが気になったら(2023/02/26追記)

 上記2製品について、今回のnoteにご意見下さいましたいぬいぬさんが詳しく研究してらっしゃいます。私も気になるテーマが。導入後役立つこと間違いなしでしょう!

最後に

 今回取り上げたものの他にもVOCALOID 6などありますが、触れてないので見送ったことについてご容赦ください。
 また、間違い等ありましたらTwitterのDMかリプ、メールでお願い致します。


この記事が気に入ったらサポートをしてみませんか?