見出し画像

AIきりたん(NEUTRINO)の使い方とより自然な歌声を実現するコツ

 こんにちは、ぼいどすです。私なりのAIきりたん(NEUTRINO)の使い方をざっくりと解説してみたいと思います。
 NEUTRINOとはVocaloidやCevio、無償のものではUTAUなどのような合成音声エンジンのひとつで、その自然な歌声はリリース当初相当な衝撃を界隈に与えました。そして無償で利用可能です。
 さらに今回は私なりのコツをご紹介したいと思います。これまで秘密にしていたわけではないのですが、なかなかそういう機会も無く、この機会にまとめることにしました。いろいろなやり方や工夫があるかとは思いますが、これが正解というわけではなくあくまでも一例として捉えていただければと思います。

前提条件

NEUTRINO

まずはご本家様。

 NEUTRINOの基本的な使い方はくろ州さんの解説がわかりやすいと思います。

 エンジン自体はMac、Windows、Linuxで利用可能で、ざっくりとした使い方としては以下のような流れです。MuseScoreは譜面作成ソフトで、これも無料です。

  1. 歌パートのMIDIファイルを用意する

  2. MuseScoreでMIDIファイルを読み込み、テンポ・歌詞を入力してmusicxml形式で保存

  3. NEUTRINOエンジンにmusicxmlを処理させてWaveファイルを出力

  4. WaveファイルをDAWに取り込む

 注意点とコツは、まず処理に非常に時間がかかること、したがって一曲分まるまる処理しようとせずなるべく細切れに・・私はおおよそ8小節ごとに分けて処理してます。細切れにすることで一部修正したいところがみつかっても、その付近部分だけ処理をし直すことができます。

NEUTRINO調声支援ツールを使う

 Windowsでのみ利用可能ですが、sigさんのNEUTRINO調声支援ツール(以下支援ツール)を利用することによって、歌詞の入力の効率化、ちょっとした修正、MuseScoreでは出来ないタイミング修正等で表現の幅を広げられます。個人的にはビブラートをかけるのに重宝してます。詳細はこれもくろ州さんの記事をご覧ください。

支援ツールを使う際の大まかな流れは以下のとおりです。

  1. MIDIファイルを支援ツールに読み込みテンポ等設定・歌詞を入力

  2. NEUTRINOエンジンを支援ツール内から呼び出して処理

  3. ビブラートやピッチ調製

  4. 支援ツールでWaveファイルを出力

  5. WaveファイルをDAWに取り込む

 やることが増えてしまいましたが、支援ツールでの歌詞の流し込みが便利すぎてかえって効率は上がっています(MuseScoreは歌詞を一文字ずつしか入力できない)。また、出力されるWaveファイルが場所が固定なので、出力されたWaveファイルはDAWのプロジェクトのフォルダに移動しておくのもコツの一つです。
※2022/09/08追記 支援ツール内からテンポ等を編集出来るためそれにあわせて修正

最新バージョンは使っていない

 NEUTRINOは開発者の方針である程度新しい世代のCPUでないと最近のバージョンが使えなくなってしまいました。私のメイン機がCore-i7  7700kなので最新版が使えないのもありますが、NEUTRINOとライブラリはバージョンによっても比較的歌い方の癖が変化しているので、使い慣れている古めのバージョンを使い続けています。エンジンは0.431、支援ツールは1.7.3.1を使っています。枯れたバージョンを使ってトラブルを回避してるとも言えなくもないかも。
 ありがたいことに、NEUTRINOは過去バージョンも公開されています。最新CPUでなくとも、Ver1以前ならば試すことができるかと。
 余談:個人的には初期の頃の荒々しいきりたんが好きです

歌い方について

 歌い方の工夫についてはこれらの他にももっといい工夫もあるかと思います。歌うことが苦手なので歌声合成を使いたいのに歌い方を勉強しないといけないという・・

「っ」や母音について

 実際に口に出して歌ってみると分かるのですが、歌詞中の「っ」は実際に発音しないか直前の音の母音を伸ばすなどになることがほとんどだと思います。以下は私のオリジナル曲「この場所でサヨナラ」より。

「二人笑って」と歌う例

 これもケースバイケースですが母音を一部変えるとよりいい響きとなると思うこともあります。

「波のようだと」この場合「う」を「お」にしているが「ー」にすると柔らかい表現となる

 このあたりは、いろいろな歌を聴き込んだりYoutubeで「歌い方のコツ」系の動画が参考になるかと。

歌い方の工夫2 ビブラート

 ビブラートは伸ばす部分の前半もしくは後半にかけるようにしてます。全部だと少しクドいなと思います。前半に掛けるとアップテンポな曲に、後半だとスローな曲に合うと思いますがケースバイケースかなと。

曲調等にもよるが一節の最後にはビブラートをかけたい

 ただ、ビブラートも掛ければいいというものでもないと思っていて、必要に応じての見極めが難しいなと感じます。なければ寂しいがやり過ぎにも注意したいかなと。

 例として上げたオリジナル曲はこちら。昭和風なサウンドは好みがかなり分かれると思いますが・・。

MIXする

 見方によってはWaveを取り込んだ時点でボーカルの録音が終わったようなものです。つまり、生歌の処理とほとんど同じノウハウが使えます。ボーカルのMIX出来る方は存分に自分のテクを駆使できます。

メロダイン

 現在DTMをやっている人であれば知らない人はいないであろうメロダイン。機械が歌っているのだから完璧じゃないの?と思われるかもしれませんが、AIだけあって一部音程が不安定なこともあったり、逆に少しずらしたいとき、微妙なタイミングの修正や、一音の長さをミスっても多少は直せます。全体にわたってやる必要はなく、必要に応じて加工し、レンダーしておきます。
 DAW等に付属してくるEssentialでも十分に使えます。

音量を変えるその1

 ちょっと大きすぎる、小さすぎる音を手作業でボリューム調製していきます。いわゆる「手コンプ」というやつです。自動でやれるプラグインもあるにはあるのですが、あんまりいい思いをしたこと無いので結局手作業でやるのが早いと思います。フェーダーより前で処理しておくとあとのダイナミクス系がラクになります。

音量を変えるその2

 MIXのテクニックで全体の音量をサビだけ2db上げるというのがあります。それをボーカルに適用しますが、私の場合は逆ににサビ以外を2db下げます。理由は私の場合サビ以外のパートが楽器数が少ないアレンジであることが多く、このほうが自然な音量差とバランスになると感じるからです。

iZotope RXを使う

 私はまれにしか使いませんがちょっと歪みっぽさが気になるときにDeClipをうっすらかけると解消されます。歪んで潰れているところを回復させる処理なので、ヘッドルームの余裕に気をつけながらの処理ですが、NEUTRINOの出力データならあまり気にしなくても大丈夫かと。

普通にMIXしていく

 ローカットEQ、コンプ、PultecとかのアナログタイプEQでハイ上げ、微調整EQ、ディレイ、リバーブを掛けていきます。空間系はダッキングしてやるとプリディレイとはまた違った感じでボーカルの邪魔をしません。
 また、サチュレーションも個人的には好きで良く使います。ただ、マスターで掛ける場合はボーカルトラックでは控えめもしくは使わなかったりします。
 あと機種はなんでもいいのでディエッサーも通しておくといいと思います。私はPlugin Allianceのサブスク入ってるのでLindell Audio 902 De-Esserをよく使いますが、Waves Gold持ってるならDeEsserでもいいですし、CubaseならArtist以上にもあるようです。
 また、古い動画ですが私なりのMIXを動画で解説してます。

ハモリ・コーラスはぜひ入れたい

 3度下のハモリや、「あー」「らららー」とかのコーラスは、特にサビなどにはぜひ入れたいところです。
 そのままピアノロールで3度下に持っていくとスケールから外れる部分が出てきますが、大体は半音下に持っていくと解決するかなと。私はあんまり詳しくないのでもっとこのあたりよく知りたい・・。
 メロダインでそのまま作ってもいいのですが、少し手間ではあるけど別のライブラリで歌ってもらうと厚みが出ますし、支援ツールにはランダムでタイミングを微妙にズラす機能もあるのでそれも利用します。
 個人的には、ですがハモリとコーラスにビブラートはかけません。

ライブラリごとの特徴

 私見ですがよく使うものをざっくりと頻度順に。もっといろいろなライブラリを試すべきとは思うのですが・・・。それぞれ得意な音域がだいぶ違い、そこから外れるとかなり苦しそうな歌い方になってしまいます。

東北きりたん

 元気の良さが特徴的で、高いところは強く、低いところはすこし抜いてという傾向があります。高音で伸ばして終わるとしゃくりあげる癖があるのでフォールさせたいときは支援ツールからピッチを書いてやります。個人的にはA3-D5がおいしい音域かなと。最高音がD5あたりに来るようにしてます。

東北ずん子

 東北姉妹シリーズ第3弾。やさしく柔らかい歌声が特徴。得意な音域の上限が少しきりたんより低く、D5は苦しそう。ただ、その苦しそうな雰囲気もすごく人間臭い。

めろう

 透明感ある声質。音量を上げても音量感がついてこないので工夫が必要かなと。最初からある程度ビブラートをかけて歌ってくれます。

謡子

 声楽的な発音が特徴。歌よりオクターブ上で歌うとベルカント唱法みたいなきらびやかさを持って歌ってくれるので、厳かな雰囲気を出したいときに最適。

東北イタコ

 東北姉妹シリーズの第2弾でした。正当アイドルっぽさあると言われています。タイミング等がじゃじゃ馬すぎて、個人的には単体でそのままだと辛いものがあると思いますが、コーラスを担当してもらうとかえって賑やかさを演出できると思います。

最後に

 このような素晴らしいものがあるとは昔は考えられませんでした。開発者・関係者のみなさんにこの場を借りてお礼申し上げます。


この記事が気に入ったらサポートをしてみませんか?