UTAU式人力についてちょっとだけ説明する
こんにちは!ひくぬてと申します。
23年の3月終わり頃からニコニコで主にYTPMVを投稿しています。
この記事では、人力を作る上で私が普段行っている方法について説明していきます。
拙い文章ですが参考になれば…
(こういうの初めて書くので言ってることがめちゃくちゃかも知れないですがお手柔らかに…)
▋この記事を書こうと思ったキッカケ
最近の話ではありませんが、UTAUを使用した人力の音MADや、YTPMVを多く見かけます。
ですが、原音設定や周波数表生成がうまく設定できておらず、発音がおかしくなっていたり、音程がおかしくなっていることが多いと感じたため、少しでも参考になればと言う思いで書いています。
では、本題に入っていきましょう!
▋音素狩りについて
|音素狩りとは
まず人力を始めるにあたって行う作業、それは音素狩りです。
必要な音素(あいうえお…など)を切り出す作業です。
基本的には、必要な音素だけを切り出す・喋っている音素をすべて切り出す・セリフ単位で切り出すなど、方法は複数あります。
メリットデメリットなども方法によって変わりますが、私は前者の必要分だけを切り出す方法で行ってます。
理由としては、面倒だから。
個人的には前者の方が作業量が減ると思っています。(多分セリフ単位で狩るのがおすすめかも?)
欲しい音素を見つけるのが面倒だったり、別の曲を歌わせる際に音素が足りないなどのデメリットがありますが、比較的早く終わると思い、こちらの方法で行っています。
ここはお好きな方法で構いません。
|手順について
私は、Audacityを使って行っています。
UTAUでustを確認し、欲しい音素を一文字ずつ範囲指定して書き出します。このとき、連続音で範囲指定をして書き出すとより自然な人力を目指せますが、とりあえず人力がしてみたい!という方は単独音でも構いません。
必ずwavで出力し、44100Hz/16bitでの出力をおすすめします。
私は連続音で音素狩りをしていますが、例として「"か" "a か"」と歌わせる場合、前の母音と違っていても綺麗に歌ってくれれば、そのまま使用しています。("か" "e か"…など)
音素狩りと同時進行で原音設定もしていきます。
同時進行で行う理由は時短のためなので、先に音素狩りを済ましても構いません。詳細は次の章で解説をします。
出力したファイルの命名規則ですが、連続音の場合は「a か.wav」など
単独音の場合は「か.wav」で保存しましょう。
音素狩りをしていると、音素が重複することがあります。
その場合は、ただ単に「か2.wav」などの表記ではなく、+(プラス)や_(アンダーバー)などを使うことをおすすめします。(か+.wavなど)
+や_の意味ですが、
+の音素は普段喋っている、歌っている声よりも高い音という意味です。
_は+の逆で低い声を意味しています。
ここは我流に行っても大丈夫です。(xは不明瞭な発音、-(ハイフン)は中間母音など…)
自分のわかりやすいように決めましょう。
▋原音設定について
私は時短、というより面倒なので切り出しと同時進行で行っています。
音素狩りを先に終わらせた方はお疲れ様です。
|原音設定のパラメータと設定目安(単独音の場合)
このパラメータ次第で発音の具合が変わります。
自動推定機能もありますが、人力向けの機能ではないので手動でやることをおすすめします。
歌わせたいノートをShift+右クリックで使いたい音素を選択し、Ctrl+Gで原音設定画面を表示させましょう。
ツールバーからツール(T)→原音の設定(S)で、一覧表示させることも可能です。
画面の見方について説明していきます。
1.オフセット/ブランク(青の範囲)
まずはじめに、両サイドの青い部分はオフセット/ブランクと言って、使用しない部分を切り取ります。
音声に無音部分がある場合はこれで切り取りましょう。
初期状態だと青い範囲が見えないので、両サイドから引っ張ってきてあげてください。
喋り声の場合、母音が少し聞こえる程度で設定すると良いと思います。
2.固定範囲(ピンクの範囲)
次に、ピンクの部分固定範囲、または子音部と言って、指定した範囲を固定させます。
どういうことかと言うと、音を伸ばした際「khhhhhあー」みたいに、子音を引き伸ばされないようにしてくれます。
セリフ合わせで母音だけを伸ばしたいときに、REAPERなどのツールで制御点を追加して伸ばしたりすると思いますが、それと同じような役割です。
よくわからない!って方は、とりあえず母音にちょっとかかるように設定をすれば大丈夫だと思います。
3.先行発声(赤の線)
赤い線は先行発声と言って、子音と母音の境界に置きます。
少しでも置く場所がズレていると、本来の発音からズレてしまうので、必ず子音と母音の境界置きましょう。
特にさ行などはしっかり設定を行ってください。
4.オーバーラップ(緑の線)
最後に、緑色の線は、オーバーラップと言います。
これはどこまでを前のノートに音を被せるかを指定します。
画像だとわかりにくいと思いますが、0msは「か」の子音部分で丁度音が途切れています。
100msに設定した場合、子音部分にも、前の音が重なっています。
デフォ子の原音設定では0msに設定されていますが、私は子音にほんの少しだけ覆い被さるよう設定しています。
この説明を元に原音設定をすれば...多分…大丈夫だと…思います…
設定目安(連続音の場合)
単独音の場合は上記の方法で問題ないのですが、連続音の場合は少し変わります。
連続音は単独音と違い、音素の前に一つ母音が入るので下記のように設定をします。
基本的には同じ設定ですが、オフセット/ブランクと、オーバーラップの設定が変わってきます。
オフセット/ブランクは、前の母音が少し聞こえるように範囲指定します。
そして、オーバーラップは前の母音の発声が終わる場所に置きましょう。
その他は単独音の設定を参考にすると良いと思います。
上記の目安で原音設定を行うと、それなりに綺麗に歌ってくれるはず…です。
連続音で歌わせる場合は、ノートを選択した状態で左上にある5つのボタンの中央を押し、クロスフェードをする必要があります。
自分の説明ではこれが限界なので、別のUTAU向けの記事や動画なども参考にするとさらにわかりやすいと思います…
▋周波数表について
|周波数表とは
音素のピッチを推定したファイルです。基本はfrq形式で保存されますが、エンジンによっては独自の形式を採用している場合があります。
このピッチ推定が正しく行われていないと、発音した時に音程がズレていたり、ノイズ混じりな声になる場合があります。
|周波数表の修正
基本的には自動推定で問題ない場合が多いですが、ガビガビな音や異音がする場合は、周波数表エディタ(masao様)にて修正が必要です。
修正したい音素のノートを選択し、プラグインを実行します。
綺麗に推定できている場合、上記のような状態になりますが…
こうなっている場合があります。
これは意図的に破綻させていますが、原音の音程に合っていない、線が途切れている場合は、
ツールバー→ツール(T)→周波数表をチェック(C)で修正を行いましょう。
原音を聞いて、音程を合わせてあげてください。
この方法でもうまく修正できない場合は、手書きで修正をしてみてください。
修正が終わったらCtrl+Sで保存をしましょう。
▋最後に
駆け足な説明が多くなってしまってすみません…
以上の方法で設定を行えば、基本的にはベタ打ちでも綺麗に歌ってくれると思います。
調声などについても書こうと思っていましたが、区切りが良いのでここまでとさせてください…気が向けば調声などの方面で続きを書こうと思います。
拙い文章でしたが、ここまで読んで頂きありがとうございました!
|おまけ
おすすめのUTAUプラグインとかを紹介させてください!
AutoPitchwriter - カノン様
おすすめです!とりあえず入れてください。
自動でピッチを書いてくれるのでこれを元に自分で調声してみたりすると良いかも。
僕の考えた最強(ry - bizz様
これひとつで何でもできちゃう
人力で使うことはあまりないかもだけど入れておいて損はないです。
拡張ピッチエディタ - Zteer様
個人的にこれ無しでは調声できませんってレベル
効率よくピッチ線を書けます。
(動画ではMode1用って書いてあるけどMode2にも対応してます)
doppeltler - 飴屋様
プラグインではなく音素を合成するエンジンです。
UTAUの開発者が制作したエンジン。デフォルトエンジンのresamplerより対応フラグは少ないものの、綺麗な出音でほとんどの音源と相性が良いのでおすすめ。
(使用する際はUTAUのディレクトリにエンジンを入れ、プロジェクトの設定から指定してください。)
http://utau2008.xrea.jp/2020/engine/
wavtool4vcv - masao様
こちらも同様、プラグインでもなければエンジンでもないですが、おすすめです。連続音のクロスフェード部分を綺麗にしてくれます。(単独音しか使わない人も入れて損はない)
(使用する際はUTAUのディレクトリにwavtool4vcv.exeを入れ、プロジェクトの設定から指定してください。)
改めまして、
拙い文章でしたが、ここまで読んで頂きありがとうございました!