ボイスチェンジャー使用者のクオリティ向上を目的とした発声方法およびソフトの設定


はじめに

Vtuber文化やVRSNSの発展が目覚ましい現在、男性であってもかわいい声で活動を行いたいと考える方も少なくありません。
そんな中、かわいい声で活動を行うための手法は大きく二つに分けられます。読み上げソフト、AIボイスチェンジャー等の他人の声を使う方法、そして女声、ボイスチェンジャー等の自分の声を使う方法です。
本記事では後者であるボイスチェンジャーについて紹介します。

また、ボイスチェンジャー環境の構築については記述しておりませんので他の記事を参考にしてください。
環境の構築には以下の記事を参考にするとよいです。

現段階での筆者の声

ボイスチェンジャーを使用して現在で2年ほどになります。
完璧とは言えませんが、聞ける声にはなっていると思います。


まずやること

ボイスチェンジャーを通した自分の声を録音して聞いてみましょう。自信をもってかわいい声でしょうか。女の子の声に聞こえるでしょうか。そうでない場合は設定、発声、または両方が正しくありません。
声の技術向上に最も大切なことは、自分の声を何度も聞いて理想の声へと近づけるようチューニングを続けることです。
ボイスチェンジャーを使っている間は常にループバックを聞くようにしましょう。

発声方法について

残念ながらボイスチェンジャーは使うだけでかわいい声になれる魔法の道具ではありません。努力をせずにかわいい声が欲しい方は読み上げソフトやAIボイスチェンジャーの使用を検討しましょう。

ボイスチェンジャーでかわいい声を出すには、設定よりも発声が重要です。
例えるならばボイスチェンジャーは目的地へ連れて行ってくれるバイクではなく、女声という自転車につける補助輪です。自身に出せる精一杯の女声の補助として使うようにしましょう。

この項ですが、この記事よりも女声についての記事を読んだ方が良いです。「フォルマント 女声」等で検索すると論文やMtFの方の記事がインターネットにたくさん転がっており、より詳細な知識を入手できます。

おすすめのpdf『あたらしい女声の教科書』が置いてあるサイトがあったのですが、現在サイトを閲覧できない状態です。
代わりに有料ですが、あまちじょんこさんの『kawaiivoiceを目指す本』をおすすめします。科学的なアプローチで女声の発声方法を提案しており、再現性が高い教材です。YouTubeにて解説動画も出されているので参考にしてください。

女声について調べるのが面倒だという方のために簡単に本記事でも解説します。
なお、この項においてはボイスチェンジャーは使用しません。


ミックスボイス

女声を出すアプローチには様々なものがありますが、今回はミックスボイスを使用したものを紹介します。ミックスボイスとは裏声と地声の間の声、と呼ばれるものです。
ミックスボイスをうまく使うことで声の質を上げることができます。

裏声と地声の周波数成分を見比べると倍音(周波数のピーク)数が大きく異なることが分かります。ここで、声の倍音数を数えるときには周波数のピークが極端に落ちるまでのピーク数を数えます。
下の画像なら裏声の倍音数は2、地声の倍音数は7になります。

裏声
地声
ミックスボイス

男性の地声はガラガラとしすぎており、そのままボイスチェンジャーに通すとガビガビとした音に変換されてしまいます。高い声も出し辛いです。
裏声では倍音数が少なく、スカスカな声になってしまいます。女性の声でもありません。
ここで重要になるのがミックスボイスです。
地声と裏声の中間となる声であるミックスボイスを出すことで双方の良いところを取ることができ、裏声のような声の滑らかさで地声に近い倍音数の声を出すことができます。
一般的に倍音数4~6あたりをミックスボイスと呼びますが、倍音数が少ないほど裏声のように聞こえてしまうため、倍音数が5、6あたりの声を使うようにしましょう。


フォルマントの変化

男性の声と女性の声の大きな違いは何でしょうか。
声の高さも違いますが、高さよりも異なるものがあります。それはフォルマントです。
フォルマントとは特に強調された周波数のピーク群を指します。
同じキーで男女が同じ歌を歌っても男女の区別が付くのは、男性と女性の声の周波数成分に違いがあるからです。
詳しくは説明しませんが、男性より女性のフォルマント周波数が高いため、フォルマントを高くすると女性の声に聞こえやすいです。

イコライザの画面でも周波数の確認はできますが、一時停止して確認できるWaveSpectraなどのアプリケーションを使うと便利です。
アーカイブページからDLできます。
https://web.archive.org/web/20200220015043/http://efu.jp.net/soft/ws/ws.html

周波数とフォルマント

人間の声の判定において特に重要と言われる第1~第4フォルマントの上げ方について紹介します。
息は声帯を通った後、喉頭、咽頭、口腔を通って声として出力されますが、これらの通り道によってフォルマントが形成されます。
つまり喉頭、咽頭、口腔を操作することによって女性らしい響きを作ることができるということです。

  • 第1フォルマント
    第1フォルマントは、舌の縦位置によって決まります。口を大きく開けて、舌の縦位置を下げることで、第1フォルマントを上げることが出来ます。

  • 第2フォルマント
    第2フォルマントは、舌の前後位置によって決まります。舌の奥を前に出して発声することで、第2フォルマントを上げることが出来ます。

  • 第3フォルマント
    第3フォルマントは、咽頭の広さによって決まります。あくびをするときのような喉の形を作ることで、第3フォルマントを上げることができます。割りばしを一本ずつ奥歯で噛みながら声を出すと咽頭の空間を広げる感覚を掴みやすいと思います。

  • 第4フォルマント
    第4フォルマントは、喉頭の狭さによって決まります。喉仏の位置を上げることで、第4フォルマントを上げることができます。

各フォルマントを上げると、『千と千尋の神隠し』のカエルのような響きになってくると思います。その喉の形のまま声の高さを上げていくと女性の声に近づけるはずです。なお、声の高さを上げる際に完全に裏声になってはいけません。地声~ミックスボイスにとどめましょう。

こちらが例になります。

ボイスチェンジャーは使用せず、喉や口内を調整してフォルマント、ピッチを上げます。


なんとなく掴めてきたら

会話は一定の高さの「あ~~~」だけでは成立しません。作った女声より高い声や、ほかの言葉も無理なく出せるようにしておきましょう。
外郎売や、北原白秋の五十音等で発声練習を行うと良いです。
作った声で歌を歌えるようになるとさらに良いです。

発声例

こちらが地声となります。

喉によってフォルマントを上げた状態、ピッチ変更なしでの声です。

喉によるフォルマント、ピッチ変更後の声です。


ボイスチェンジャーについて

それらしい声を出せるようになった方はボイスチェンジャーの調整に入っていきます。
ボイスチェンジャーを使うと音質が低下するので入力の音質(マイク、オーディオインタフェース)はなるべく良くしておきましょう。

ピッチ・フォルマントシフタ

この項ではピッチ・フォルマントシフタのGFormを例として紹介します。

GForm

ピッチの設定値は上限が6、フォルマントの設定値は上限が2です。
それよりも高い数値に上げてしまうと声が破綻します。
バ美声等を使っている場合:2→112%、6→141%

ボイスチェンジャーは声の周波数成分を無理やりずらしているため、強くかけると簡単に破綻します。数値は低ければ低いほど自然に聞こえます。

地声で200Hz程まで出せていればピッチの値は2前後に設定して良いですが、声に無理がある場合は聞いている側も心地よくない声になってしまいます。はじめは無理のない範囲でピッチを調整し、次第に設定値を落としていくと良いです。

録音して聞きながら、もしくはループバックを聞きながら一番かわいいと思える点を探りましょう。
「あ~~~」だけではなく、文章を読んで録音するとより良いです。


イコライザ

ボイスチェンジャーの仕様上、ノイズが入るとそれだけ破綻に近付くため、できるだけ不必要な音を削りましょう。
プラグインを適用する順番は1.イコライザ 2.ノイズ除去 3.ボイスチェンジャーにすると良いです。ボイスチェンジャーが後です。

Ozone 11
  • ハイパス(ローカット)を100Hzあたりにかけます。女性の声で100Hz以下の音が出ることが基本的にないためです。皆さん男性も地声を使うことはないため、100Hz以下の音は出ません。

  • ローパス(ハイカット)を20kHzあたりにかけます。この周波数あたりを越えるとあまり声に関係が無くなってきます。

  • 100Hz~300Hzあたりの音を上げます。声の温かみ、太さを補強することができます。

  • 1kHz~2kHzあたりの音を上げます。音の聞き取りやすさに関わってくる部分です。ただ、声がキンキンと響くような場合は下げてしまっても構いません。不快にならないように調整しましょう。

その他プラグイン

コンプレッサでバランスの調整を行う、ボイスチェンジャーの後に薄くリバーブをかけると声の深みが出るなどありますが、プラグインはかけるほど本来の声を歪めることになります。音質も低下していき、遅延も増えるのであまりプラグインは多すぎない方が良いです。


発声例

こちらがボイスチェンジャーを使用していない状態での声です。210Hz前後で発声をしています。


こちらがボイスチェンジャーを使用した状態での声です。ピッチ・フォルマントともに数値は1.5です。


気を付けておきたいこと

クオリティの低い声は会話を困難にするだけでなく、聞いている人を不快にさせてしまう場合があります。
「自分は気にしないから」ではなく、他の人のためにボイスチェンジャーを使う限り良い声であることに努めましょう。

地声でボイスチェンジャーを使用するとこうなります。ピッチは12、フォルマントは5となっています。

聞いていられませんね。


最後に

ここまで技術の向上について解説しましたが、ボイスチェンジャーによるかわいい声は一朝一夕に手に入るものではありません。
普段の地道な練習によって日々上達を続けていくことが大切です。

もしも身近に声の欠点を指摘されても関係が崩れないような方がいるのであれば、第三者の目線で指摘をしてもらうとよいです。

なお、本記事はあくまで筆者ひとりの意見であり、唯一の正解というわけではありません。ボイスチェンジャーを使ったかわいい声にはいろいろなアプローチがあります。自身に合った方法で上達を目指しましょう。

ご指摘、ご意見がある方はコメント欄に気軽にお送りください。


この記事が気に入ったらサポートをしてみませんか?