SynthesizerV AI 調声の仕方とか使い方とか3(調声・発音)

ハチナナです。

始めに

SynthesizerV(SynthV) AI をみんなに使ってほしいので使い方を書こうと思います。

前回までの記事

前回までの記事→
第1回 ベタ打ち作成
第2回 ピッチ

この記事について

機能紹介というよりは、実際に調声するならこんな手順かな~というような流れに沿ってそのタイミングで使うものについて適宜説明していく予定。

今回は調声なので機能紹介という感じでもなくテクニック集という感じでもなく微妙な感じになる予定。

使用バージョン

SynthVは頻繁に更新されるので、執筆時点での私のSynthVのバージョンを書いておきます。

Synthesizer V Studio Pro 1.6.1
Synthesizer V Engine 2.4.1

バージョン情報はメニューバーのここから確認できる

Pro(有料版)で説明するため、無料版を使っている人にはない機能が出てくることがありますが、その時は諦めて有料版を買うか、見なかったことにしてください。

目次


調声ですること

調声ですることは大きく4つあります。
(個人の意見です、人によってはもっと細かく分けるかもしれないし、同時に考えるものもあると思います)

  • ピッチの調整

  • 発音の調整

  • 声質の調整

  • 抑揚の調整

完全な私見ですが、

  • ピッチの調整と発音の調整は全ての土台である

  • ピッチの調整と発音の調整は関連が深いので同時に考えた方がよい

  • 声質の調整は味付けであり、だいたいどのタイミングでやってもよい
    (最初に大まかな方向性を決めておくとほかの部分の調整がやりやすい)

  • 抑揚の調整は土台がしっかりしていないとできないので最後にやる

今回は発音(音素)編です。

発音の調整ですること

発音の調整ですることは以下です。

  • ノートプロパティ/タイミングと音素/長さ

  • ノートプロパティ/タイミングと音素/強さ

  • ノートプロパティ/タイミングと音素/代替音素

  • 音素編集

  • ノート分割

  • ノートプロパティ/タイミングと音素/ノートオフセット

  • パラメータ

音素の長さ

ノートプロパティ/タイミングと音素/長さ で、各ノートの各音素の長さを設定することができます。

各音素ごとに長さを変えられる
(20%~180% 5%刻み)

音素の発音タイミングは、前のノートの音素と次のノートの音素にも影響を受けます。
1つのノートで音素の長さを設定していても、前のノートの母音や次のノートの子音の長さを変更すると長さの割合が変わります。
子音を伸ばすと前のノートの母音がその分短くなる、母音を伸ばすと次のノートの子音が短くなるということを覚えておくと少しわかりやすいと思います。

子音は前のノートに食い込む

ノートには3つ以上の音素を入力することもできます。
最初の音素が子音であればノートの前に出、子音でなければノートの開始タイミングから発音します。
最初の子音以外はノートの内部に入り、長さで割合を設定できます。
次のノートの子音がある場合は次のノートの子音の長さも気にしておく必要があります。

2つ以上音素があるとき、子音以外の部分は後ろに並ぶ
長さで割合を決めるが、次の子音の長さも変わる

次のノートの子音の長さを変えたくない場合、子音だけノート分割で出すと、ノートの長さで固定できます。

子音をノート分割で前に出してしまえば次の子音の長さは固定される

子音の長さは、慣れるまでは意味が分かりにくいですが慣れれば普通に使える機能です。

自分は基本的に子音の長さだけ触ります。
母音を二つ以上入れるときだけ母音の長さも変えます。
子音の長さを変えるときは、とりあえず50%程度にしてからさらに短くするかもうちょっと伸ばすかを考えると楽になると思います。

音素の強さ

ノートプロパティ/タイミングと音素/強さ で、各ノートの各音素の強さを設定することができます。

各音素ごとに強さを変えられる
(20%~180% 5%刻み)

ちゃんと使えると強そうですがあまり使ったことがないのでよくわかりません。

なんとなく子音が強い気がする場合、強さより長さが原因のことが多いので先に長さを調整して、どうしても直らない場合は強さで弱めるというのがよいかもしれません。
(tなどの子音の無音部分が長すぎるのに強さだけ弱めてもどうにもならないみたいなことがあるため)

音を出さない系統の音素(sil、cl、br等)は、弱めると声が混ざるので音が大きくなります。

代替音素

ノートプロパティ/タイミングと音素/長さ の横のボタンで、各ノートの各音素の代替音素を設定することができます。

各音素ごとに音素を変えられる
(DFLT、ALT1、ALT2)

発音が変わるらしいですが、自分は聞き分けができないため無視しています。
聞き分けができる人は使ってみるといいと思います。

音素

ノート上部の音素のエリアでダブルクリックするか、ノートプロパティ/タイミングと音素/音素 で音素の編集ができます。

以下のことができると思います。
・特殊音素を使う
・似た発音の別の音素に変える
・音素を増やす

特殊音素

[sil]
無音部分はこの音素になります。
ノートがない場所は自動でこの音素になっていますが、手動で設定することもできます。
silのノートを使うメリットは、ノートが置けるのでポルタメントが効く(高いところに置けばピッチを上に引っ張れる、低いところに置けばピッチを下に引っ張れる)ことです。
ノートプロパティのピッチ推移を組み合わせると語尾の処理などでできることが増えます。

[cl]
促音(っ)にあたる音素です。声門閉鎖のような音も出ます。
母音の前に置くと、喉を閉めてから母音を出すときのようなアタック感を出すことができます。
音を一気に切るときはsilよりもclという感じです。

[br]
ブレスです。
息を吸います。

[pau]
よくわかりませんが、発音できます。
pauseの略だと思うので、上手く使えば音を切るときに使えるのかもしれません。

似た発音の別の音素に変える

[t]を[ts]にする、[sh i]を[s i]にする等可能性は無限大です。
色々やってみるといいと思います。

音素を増やす

母音の言い終わりを別の母音に変える、子音の前にNを入れてタメるなどすると、接続が滑らかになったり、ひねった歌い方になったり、口の動きが感じられるようになったりすることがあります。
1つのノートに複数音素を入れるとできます。
(日本語の母音をそのままバッと出すと情報量が少なすぎてダサいみたいなところがないとも言い切れないですが……音素を増やすと情報量が増えます)

ノート分割

ノートを分割してできることは大きく2種類です。

母音分割

母音を分割します。
VOCALOIDでは後ろをハイフンにするか母音にするかで音が変わるとされていますが、SynthVは多分特に気にするほどでもないと思うので気にしないで全部ハイフンでいいと思います。

子音分割

子音を分割して前に子音だけのノートとして出します。
子音の長さをノートの長さで調節したり、前のノートに食い込む長さを固定したりできます。
グリッド最小にしてもそこそこ長くなってしまうので、スッと流すような短い子音には向かず、ある程度タメる長さのある子音向けです。

ノートオフセット

ノートプロパティ/タイミングと音素/ノートオフセット でノートオフセットの調整ができます。
発音開始タイミングをミリ秒単位で動かせるので、グリッドで動かしてるとちょっとだけズレるときに使えるといいと思います。
ほとんど使ったことはありません。

パラメータ

テンション・ジェンダー・有声/無声音等のパラメータを書くと、発音の仕方が変わるため、発音が気になるところにだけ書けば発音の調整に使えます。

ジェンダーはわかりにくいですが、ちょっとだけ上げると喉が開いたような感じ、ちょっとだけ下げると喉を閉めたような感じにできるので、使いこなせばかなり強いと思います。

このあたりはだいぶ理想像がはっきりしてないとどこに何を書くかが決められずに迷走するので、参考にする歌声を用意していないと厳しいです。

実際何するか

実際何するかは人によって違いますが、
自分は以下です。

  • 子音が長いところを短くする

  • タメが足りないところをタメる

  • 母音の連続するところをくっつける

  • 遊べそうなところで母音など音素を増やす

同時にピッチ遷移についても考えつつ、しゃくりなどを入れたりもします。
同時並行でやります。

やる人はおそらく、喉の開きや声の張りなどを考えてパラメータを書くみたいなこともするんだろうな~と思っていますが、自分はできないのでやっていません。一か所書くと全部書かないとバランス取れないので。

子音が長いところを短くする

SynthVは子音の発音がしっかりしているので、基本全部の子音が長いです。
なんなら全部まとめて50%とかにしてもいいくらい子音が長いです。
タメるところとアクセントは短くしなくていいです。

タメが足りないところをタメる

タメが足りないところはタメます。
アクセントをつけるところは基本的にタメがあると思います。
ピッチでしゃくりがあったりもします。

タメる場合、
・子音を伸ばす
・子音の前に「ん」を入れる(b、r、m、n等)
・前に[cl]を入れる(続く音が母音のとき)
等があります。

母音の連続するところをくっつける

歌詞の表記上は分かれているが一音で二文字発音するべきだろうという部分は1つのノートにまとめます。
長さパラメータで調整した方が自然になりやすく、まとめてビブラートをかけたくなった時などに楽なのでまとめています。

遊べそうなところで母音など音素を増やす

母音やNなどが足せそうなところは足します。
どこに足せそうかは完全にフィーリングです。
たくさん聞いて感覚を養う以外に方法がなさそうな気がします。

口が閉じるような雰囲気でu、Nをいれたり、i→eで少し口が開いたりというのをとりあえず入れてみて、調整していい感じにできればそのまま、ダメならなかったことにする等
基本的に語尾が一番いろいろできますが、途中にいろいろ挟むのも大事そうな気がします。
通して聞いた時におかしくないかが一番重要な気がします。

おわり

発音はあんまりテクニックみたいなものもいじるところもないのでちょっと短くなりました。
ただし、自動調整で調整してくれないところなので地道に全部調整するしかないところでもあります。(抑揚は自動でやってくれるようになるらしいですが)
子音が長いところを短くして、タメるところはタメましょうというのが全てだと思います。

To Be Continued……


いいなと思ったら応援しよう!