見出し画像

旧約 VRChat 始めて1年過ぎたので女声についてまとめる〜 理論・考察編1 〜【 VRCHAT 】

こんにちは、あんくるです。前回の女声の出し方編の理論と考察をデータを踏まえて長々と書いていきたいとおもいます。全部飽きず読めたらちょこっと賢くなるかもしれません。

追記
書いてみたら長くなってしまったので、いくつかに記事を分けて追加していく方式にします。
今回取り上げるのは元の身長と元のフォルマントが女声を出せない理由になるかどうかについてです。例えば、身長が低い、小柄ならば女性に近い共鳴腔となり女声は出しやすいと考えられますが、逆に身長が高い、もしくは男性的であると女声が出せないという事はあるのかどうか。それと後半は女声とは何かについて、内容は女声の声質の種類とその違いについてです。


体格と女声について

声質について述べる前に体格が原因で女声が出せない事があるのではないかと思ったのでそれについて考えてみます。まずはよく言われているフォントの法則について。よくこの法則を根拠に身長と声の基本周波数の高さは“反比例する”とよく言われています。ですが調べてみるとフォントは声帯と基本周波数の関係については述べていますが、声帯自体が身長と比例関係にある事を調べた内容ではないです。
なので他に体格と声との相関関係について調べているものを捜してみました。


1つ目は成人の日本人男性15人を対象にMRIデータより声道長と身長・フォルマント周波数の相関関係を調べたものです。※1波多野ら(2012)

声道長と身長に相関は無い
声道長とフォルマント周波数に相関は無い
基本周波数は身長と相関する

この中では上記の結論が出されています。ただ、この研究はサンプル数が少ないとの指摘もされています。


2つ目、2013年の米国音響学会では、被験者24名に、発声者の音声から身長を推定できるかという研究を行い、62.17%の確率で身長が高いか低いかを当てる事ができるとジョン・モートンにより発表されました。彼は同時に推定できる理由が喉仏より下で発生する声門下共鳴にある可能性を示唆しています。※2 ちなみに声門下共鳴の差は男女間でも見られる。※3


3つ目、ブラジル サンパウロ大学で行われた13人の男性と11人の女性を対象に正確に声帯の寸法を知る事を目的にした研究。※4Aragãoら(2003)
この研究からは以下の事が分かっています。

男性の声帯は、女性のひだよりも大きく・広いが、厚さには差がない。
個人の身長と声帯の長さには強い相関関係が見られた。
声帯の高さと幅、厚さには相関関係はなかった。

これらよりAragãoらは
男性の声帯は、女性の声帯よりも大きく、幅が広い。声帯の長さは、個人の身長に相関関係がある。』と結論づけています。また、Aragãoらはこの研究を発展させ、身長から声帯の長さを求める以下の方程式を提案しています。※5

男性 y = 0.18x - 15.8
女性 y = 0.24x - 28.1
( y は声帯の長さ(mm),  x は身長(cm))


まとめると身長と関係があるものは、声帯の長さと声門下共鳴でそれにより基本周波数(声の高さ)・声門下の響きの違いがあります。またこれらの結果より、身長が高いからと言って首が長いわけではなく、長くても影響はないという事もわかります。


ですが、イメージ出来るほうが理解が早い人もいると思います。百聞は一見に如かずともいいますので実際に見てみましょう。
YouTubeで高身長で女声を出す人を探すと2人見つかりました。 ふぇありすさん Fairys Channelあまちじょんこさん あまちじょんこ[johnko amachi] お二方とも身長が180cmありおそらく体重も平均的だと思われます。ふぇありすさんは3桁いっていると動画がありましたけど平均的という事にしましょう...

私が聞く限りでは立派に女声として聞こえますので、身長が高いから女性らしく聞こえないというわけではないようです。サンプルが少ないですが身長が高くて問題になる事はカバーできるか、はっきりとした影響はないものとします。

また、太っている方が高い声・いい声が出ると思った人もおられるかもしれないですが私の実感としては当てはまらないですね。ちなみにオペラでは太っている人が多いですが、それは太るほど肺活量が上がる、または喉頭の周りに大量の脂肪があると共鳴能力が高まり心地よい音がでると信じられているからだそうです。それを調べる研究等は見つからないですが、オペラ歌手は胸郭が大きくなりやすく、そのせいで実際より太って見えるのではという研究はされてます。※6 結果がどうあれ彼らのように会場と病院を往復する生活は避けたいものです。


男声の声質と女声について

体格は関係ないとしても、元が低音ボイスなら出せないことがあるかもしれません。その時はどうなるか見てみましょう。この時の低音ボイスとは基本周波数が低い声と定義します。
これもYouTubeで探してきました。

くず鉄さん くず鉄

この人も女声に聞こえますね。低音ボイスであっても問題はなさそうです。後で出てきますが、基本的に270Hz、低くても217Hzまで出せると女声発声では問題ないありません。音階ならD4(高いレ)くらいの音です。 音域.com



では、基本周波数ではなくフォルマントが低いときはどうなのか。女声発声では基本周波数とフォルマントの2つを主に意識して動かします。基本周波数は問題ないので、次はフォルマントを見てみます。ちなみに『あ』の音が出し方も簡単で比較するのに最適なのでよく使われます。では今回あげた3人の男性の声での『あ』のフォルマントはどうなのかというと

F1         F2         F3          F4          Pitch 
ふぇありすさん
730Hz 1300Hz 2610Hz 3650Hz Pitch160Hz
あまちじょんこさん
720Hz 930Hz 2780Hz 3650Hz    Pitch97Hz
くず鉄さん
628Hz 960Hz 3000Hz 3750Hz   Pitch100Hz
筆者
490Hz 1200Hz 2850Hz 3950Hz   Pitch108Hz
※じょんこさんと私以外は動画からサンプリングしてるので精度はお察し


こう見てみるとフォルマントだけを見てもわかる事があります。第3フォルマント(F3)は高いとさわやかな感じ元気な感じに聞こえます。テンション低い声、落ち着いた声はここも低めになります。ちなみに私個人が男性20人ほど調べた所、一般人・声優ともイケボとされる人達はここが3000Hz付近にある方が多かったです。基本的に男性は2700Hz付近が平均であるという調査結果が多いですのでF3が高いこととイケボの定義とは関係があるのではないかと考えてます。

また、基本周波数(Pitch)の違いでも印象が変化するのが分かります。基本周波数が高いと若いと感じるのではないでしょうか。実際、年齢推定に基本周波数の高さが関係している事は多くの研究から証明されています。※7
あと残りは、F1,F2が言葉を形成し、F4は後頭部のチリチリ感?でしょうか。感覚的にすぐ分かるのはF3とPitchくらいです。ここで話した基本周波数・フォルマントから声の印象が予測出来たら理解が高まります。

また著者の第1フォルマントが著しく低いのは何故でしょう...基本的に平均は600Hz付近が多いのと自身で調べたサンプル25例の中でも見かけないので、著者はモルモットとしては最適かもしれません。

では次に女声時の『あ』のフォルマントを見てどの程度変動するのか見ていきましょう。

F1         F2         F3          F4          Pitch         
ふぇありすさん(お姉さん声)
870Hz 1770Hz 3500Hz 4500Hz Pitch300Hz
あまちじょんこさん(ロリ声)
850Hz 1700Hz 1940Hz 4550Hz    Pitch390Hz
くず鉄さん(少女声)
825Hz 1430Hz 3700Hz 4400Hz   Pitch290Hz
※じょんこさん以外は動画からサンプリングしてるので精度はお察し

動画からではやはり難しいので耳で聞き取ってサンプリングしましたが、発声方法が一定でないので目安程度にしてください。


女声のフォルマントだけ出されても目標となる元の女性のデータが無ければ比較ができないですよね。という事で※8櫻庭ら(2009)、野口ら(2016)、粕谷ら(1968)の研究から引用させてもらいます。海外でも同様の研究がありますが、日本人女性の声は世界一高いとも言われており、日本人を対象にしている点で貴重な研究になります。※9

女性と判定される基本周波数 : 217Hz

かわいい声と判定される平均の基本周波数 : 270Hz以上

女性の『あ』の発声時の各フォルマントの平均
F1: 888Hz         F2: 1363Hz          F3: 3050Hz

ちなみに欧米では、Wolfeの研究で172Hz,Gelferの研究で187Hzが女声と判定される基本周波数となっていて、日本人の方が高くなる事が分かります。それと、語尾を伸ばしている声はかわいくない印象になるらしいですよ。


ここまでフォルマントを見てきましたが、F1,F2,F3,F4はそれなりに可動域があり多くの人は努力次第で容易に調整が可能です。ですが、F1(第1フォルマント)の可動域は100~200Hz程と感じています。ですのでTwitterで検索してもF1を上げるのに苦労している人を見かけます。私も苦労しています。ですので、私のように元からF1が低い人は少し大変かもしれません。前に述べましたが、F1が低い人はあまり見かけないので無視します。けどそのうち記事は出します。


女声の声質について

本題です。女声にはどのような声質があるでしょうか?今回は3つほど取り上げてみます。

声質:ナチュラル女声

街中で見かけるような自然な女性の声です。以下の2系統をよく見ます。ふぇありすさんとくず鉄さんがこのタイプになると思いますが、系統が別なのにフォルマントを比較してみても大きな違いは見られません。ですので別の特徴をもって区別する必要があります。

そのためにスペクトラムアナライザーを使用します。spectrumとは(英)『連続体・分布範囲』の意味で、音響で用いるなら声に含まれる周波数成分を指定した範囲で取得したものです。横軸を周波数、縦軸をその周波数の時の入力の強度として表示します。(今回はフリーソフトのWaveSpectra使用)

少女系

普通の女の子の声です。女子にとっては声を変えてないナチュラルな声です。ピッチが高く、それにF1,F2が影響を受け、F1,F2もピッチが低い人より高くなってます。F3,F4はピッチの影響をあまり受けません。すっきりした印象を受けます。
spectrumを見ると1k~7k付近までなだらかに下がっています。女性の声道は直線に近いのでこういう形になりやすいのですが、聞いた感じ地声感があるのでフラットな形になっているのではないでしょうか。裏声になると声帯だけでなく、声帯付近が広がったりと声道形状も変化し、spectrumの形もデコボコします。加齢により、地声で高い音がきつくなると力が入ったり、裏声になったりして声道形状の変化がおこりspectrumの形も複雑になるのではと考えています。
このspectrumの形状だけ出してもどんな感じの音が出るのかイメージしにくいので参考にこちらのURLを カラードノイズ 
詰まる、すっきりするイメージを感じてもらえたらと思います。

F1         F2         F3          F4          Pitch           
1100Hz 1750Hz 3000Hz 4200Hz Pitch280Hz

(Sample1: 声は高めの落ち着いたJKyutuber)

春のなまけものh

・くず鉄
・パカエル / Pakael 基礎からしっかり女声解明!!両声類講座【地声アプローチ基礎・入門編】
・あいくん。【声とも】女声から声真似で対抗したらカオスな展開に‪w‪w‪w【女声釣り】
・USINOOTITI magnet 一人で両声類っぽく歌ってみた 【牛乳】

お姉さん系

へっちな人はみんな大好きな声ですね!吐息を含ませ裏声にすると出来ると言われます。例として某女性Vtuberさんの普段の声とお姉さん声を出します。1人目でピッチが0.95倍程,フォルマントがF1で0.65、F2,F3,F4は変化はありませんが、スペクトラムで見ると1.5kHz以下、また10kHz付近も強調されてます。2人目はピッチが1.2倍,フォルマントがF1,F2,F3,F4が1.1~1.2倍になっていています。また1.5kHz以下、また10kHz付近も強調されてます。これをささやき声を混ぜてピッチを操作した声とすると先行研究※10 と同様な結果がみられるのではないでしょうか。また10kHz付近のは呼気流量増加による摩擦音。1人目は深みがあり、2人目は軽い感じなお姉さんを感じます。

1150Hz 2000Hz 3500Hz 4700Hz    Pitch200Hz    (before)
750Hz 2000Hz 3300Hz 4400Hz    Pitch190Hz    (after)

990Hz 1400Hz 3200Hz 3900Hz    Pitch226Hz    (before)
1100Hz 1800Hz 3800Hz 4900Hz    Pitch274Hz    (after)

(Sample1: 白銀ノエル  Sample2: 尾丸ポルカ 『あらあら』)

白銀ノエル

尾丸ポルカ

・ふぇありす
・ゆうなぎゆずき 両声類VTuber [両声類]女声の出し方入門編
・ましゅー! 男がナチュラル女声で未来予想図Ⅱ歌ってみた!


声質:アニメ声・ロリ声

特に理由はありませんが、雰囲気が似ているのでまとめて紹介します。

アニメ声

アニメの女性声優のような声です。アニソンを歌う時、声で遊ぶ時に重宝します。VRCHAT内で普段の声として使われてる方はあまり見かけません。
例として某女性Vtuberさんの地声と普段の声を出しますが、1人目でピッチが1.6倍程,フォルマントがF1,F2で1.2倍、F3,F4は変化はありませんがスペクトラムではこの付近が強く出ています。2人目はピッチは1.1倍程,フォルマントはほぼ変化なしですがF3,F4付近が強く出ています。
F1,F2の変化はF1,F2が基本周波数の影響を受けやすいのでその結果高くなっており、スペクトラムの変化は裏声発声で喉頭(のど)が下がり、中咽頭(口の奥)・下咽頭腔(のどの真うしろの食道)が広がる事で3k~4k帯のエネルギーが強調されたものと思われます。つまり、女性なら裏声出してピッチ上げ滑舌悪くすれば出来ます。

1025Hz 1600Hz 3000Hz 4350Hz    Pitch213Hz    (before)
1250Hz 1900Hz 3100Hz 4300Hz    Pitch348Hz    (after)

1100Hz 1700Hz 3300Hz 4500Hz    Pitch243Hz    (before)
1150Hz 1750Hz 3750Hz 4800Hz    Pitch286Hz    (after)

夏色まつり1

ぎばら

・桜楽屋のよろずん 両声類・多声類を目指して!自己満足☆声の変え方講座[第二弾]
・あぐり【女声で歌ってみた】 ラブライブ!サンシャイン!!未熟DREAMER
・madotsuki channel  男二人wwwで「干物妹!うまるちゃん」のOPの「かくしん的☆めたまるふぉ〜ぜっ!」歌ってみたwwwwww

ロリ声

ロリ声は幼児の声です。ロリ声に関しては、1,000~2,000Hz域にF1,F2が集中し、スペクトラムでも同様にこの付近が強調され、ピッチも高いという特徴が確認できます。ちなみに、子供の声が嫌いな人がいますがそれは2,000Hz域の周波数を不快に感じるからであり、何かあったら親や周りの大人がすぐに気づけるようにする為だと言われています。
また、ロリ声をVRCHAT内の普段の声として使ってる方はそこそこ見かけます。

720Hz 930Hz 2780Hz 3650Hz    Pitch97Hz    (before)
850Hz 1700Hz 1940Hz 4550Hz    Pitch390Hz    (after)

(Sample1: あまちじょんこ氏)

ロリ

・あまちじょんこ


声質:中性声

中性声

男性か女性かわからない声の人もいます。中性的になりたい人、元から声が高い男性、Xジェンダーの方など。声のピッチは中間くらいで男性とも女性ともとれない話し方をされます。

男みが消せてない声

女声を練習中でまだ発展途中の声です。女声が完成するまでの間しか聞けない声です。儚くて美しいですね(?)
ただ、男性の低音が残っている感じと多少高めの女声、それとフォルマント調整後の明るい声、これらが混ざった声に安心感を得たり、惹かれる人もいるようです。低音だと低音からの倍音が発生し結果倍音は多くなりますし、低音からの倍音が含まれることで声道特性が反映され音韻性が明瞭になり言葉が聞き取りやすくなります。一石二鳥の声なのかもしれません。


(おまけ)女性の吐息・呼吸法

これに関しては、前にフレンドと話した女性の声と男性の出す女声との違う点を検証してみたものです。話した内容としては、いくら上手くなっても聞けば男性ってわかる部分があるよね。って感じでその違いを彼(彼女?)は「女性の吐息」「女性の呼吸法」とその時は言っていました。その違いを主観的にいうと、吐息のようなふんわり感、優しい感じでしょうか。そういう雰囲気です。解説サイト等にはないので仮に名付けて「女性の吐息感」としときます。女性ならばこの普通に話していても女性の吐息感をふくむ声になっていますが、男性の女声ではこれが含まれない人がいて鋭さ感、ハッキリしすぎている感があります。まぁ、持てる人は女性に近い声帯をされているのでしょう。

ではこの女性の吐息感はどのように生まれるのか。まず、男性と女性では声帯の閉じ方に違いがあり、男性は声帯を閉じる時完全に閉鎖されるが、女性では後部声門が完全に閉鎖せず隙間が空いたままとなっています。この違いから、常に息漏れが起きている状態になり、ふんわり感、優しい感じが生まれるのではないでしょうか。またこの声帯形態ゆえ、声道を共鳴管に見立てると女性は完全な閉管とならなくて、片方が開いてる管として見ると共鳴周波数も高くなるので女性の声は男性より高くなっているとの意見もあります。


(おまけ)地声・裏声とは

それぞれの印象として、地声は「しゃべり声、低い声、胸に響く声、”張りがあり力強い印象」、裏声は「高い声、頭に響く声、弱い、純粋、優雅」のどれかを感じますね。

ではそもそも地声裏声とは何でしょうか。日本語の意味は、地は『本来もっている性質。もと』となり地の声とは元の声となります。裏は『うら。衣のうら。物のうらがわ』となり地に対し裏の声となります。なぜか日本では換声点を越えて裏声になる事を「声がひっくり返る」とよく言います。そこから来ているのでしょう。
ちなみに海外の教育現場では古くから体に感じる振動を元に男性はチェストボイス・ヘッドボイス・ファルセット、女性でチェストボイス・ミドルボイス・ヘッドボイスが使われ、言語病理学と音声学では研究が進み声帯の振動形態を解明できたことからvocal fry・normal voice・falsetto・whistleの4つに分けて分類されます。日本語に直すとボーカルフライ(エッジボイス)・地声・裏声・ホイッスルとなり、言葉で表すと以下の感じになります。

無題dffdfdfewedf

ここで見てわかるように従来の声区では被ってしまう部分があり、それ故に言葉で説明する時に混乱が生じていました。例えば、女声の出し方の蛙声法では低い声を出し、千と千尋の神隠しの蛙のような声を出すといいますが、その後ピッチを上げていくのに裏声の方か地声の方か悩んだこともありました。

おまけなので脱線しますが、海外では体に感じる振動を名前に、日本では切り替わる時の違和感を名前にしています。言語として英語は日本語より音の高低差があるので、自然に裏声を使いこなせるようになりそういう違和感を感じないのはないでしょうか。わかりませんが。


話をもどします。地声裏声などの声の分け方は時代により進化している事を話しました。次にこれらは基本的に何が違うのかについてです。

その前に声帯について。この声帯とは何でしょうか。元は気管と食道が繋がっているので、食べ物・飲み物が誤って気管に入る事が無いようにするための筋肉のヒダでした。ここだけでなくその気管の入り口にも喉頭蓋という名前の通りのふたがあります。それと気管自体を上に引き上げて気道の入り口も狭くした上で2つの機能は働くので、計3つの異物排除機能を潜り抜ける事が出来れば、異物はむせさせる事に成功します。そして、そのヒダを息を吐く時に閉じるとヒダが震えて音が出る事を見つけた事から人類は発声機能を獲得し、その後構音機能も発達しコミュニケーションを取れるまでになりました。

その声帯の状態ですが、大雑把に地声の時は筋肉が緊張していて厚みがあります。元の異物排除の目的を考えれば基本状態がこうなるのは納得しやすいかと思われます。次に裏声は筋肉の緊張が弱まり薄く引き伸ばされます。ではこの状態で息を吐いてみます。

無題dfdf

( あんくる画伯作 )

ではこの状態で息を吐いてみます。

無題dfewedf

( あんくる画伯作 )

簡単に言うと地声は厚く接触しているので声帯を震わせるために必要な息の圧力が大きくなり、振動のパターンも複雑になりやすい。
次に裏声は薄く接触しているので必要な息の圧力は小さく、抵抗なく震えます。ここが1秒間に震えた回数が声の高さになります。ですので高い声を出す時には震えやすい裏声発声の方が楽に声を出す事ができます。

ですが、人は踏ん張る時ここに力を入れがちです。それは、胸の中には肺があり、大きな割合を占めています。筋肉は外側についていますが、人間は外骨格ではないので中が萎むと支えきれません。なので、声帯や仮声帯に力を入れ閉じる事で、肺の空気を閉じ込め踏ん張ることができます。ただ、高い声を出す時も同様に力を入れてしまうので、ここがどんどん厚くなり震えさせるのに必要な圧力が増え、声帯を傷める原因になります。

ですので、最初は意識して裏声を出せるようにして高い音を出せるようにしましょう。

また、この地声・裏声の違いで含まれる倍音も変わってきます。音屋なら分かるかもしれませんが、裏声の音声波形は時間とともに滑らかに声帯が震えて正弦波のような形になります。地声は声帯を動かす為の圧力が溜まるまで時間がかかるので形が崩れ、閉じる時は一気に閉じるのでノコギリ派のような形になります。この波形の形状で奇数倍の倍音が多く含まれるか、偶数倍の倍音が多く含まれるか、両方が多く含まれるか決まるのではないかと考えてます。※11粕谷ら

この違いが地声感・裏声感と思いますので、裏声ながら地声感が欲しいなら薄いまま筋肉を緊張させ弾力を持たせる必要があります。


おまけ、仮声帯について

声帯の少し上に第4の異物排除機能の仮声帯があります。こちらも声帯と同様に異物を防ぎ、踏ん張りをしやすくします。形が似ているのでこういう名前になったと思われます。ただ、声帯の様に細かい操作は動かせません。ですが、デスボイス等や芸人の浜田さんのような声を出すにはそれで問題なく、また声帯にダメージを与えないので必要なら練習してみましょう。声帯でそのような声を出して壊し治らなくなった人も多いですからね。



参考文献

斉田 晴仁『声の科学: 歌う医師があなたの声をデザインする』(2016)

あまちじょんこ 『KawaiiVoiceを分析する本』(2019)

※1 MRIにより計測した声道長と音声データとの関係 (2012)

Correlation between vocal tract length, body height, formant frequencies, and pitch frequency for the five Japanese vowels uttered by fifteen male speakers (2012)

※2 Listeners Can Distinguish the Voices of Tall versus Short People, According to a Study Presented at a Meeting of the Acoustical Society of America in San Francisco (2013)

※3 Subglottal resonances of adult male and female native speakers of American English(2012)

※4 Correlation between height and vocal folds dimensions(2003)

※5 Length of the Human Vocal Folds: Proposal of Mathematical Equations as a Function of Gender and Body Height(2005)

※6 Patterns of breath support in projection of the singing voice(2001)

※7 声質の伝える情報とその関連量(2012)

音声の基本周波数と抑揚が知覚年齢に及ぼす効果(2014)

話者の平均基本周波数は聴者を揺さぶる : 知覚・年齢推定・気分に与える影響 [in Japanese](2020)

※8 女性と判定される声の特徴(2009)

「かわいい声」と印象語の関係(2016)

年令, 性別による日本語5母音のピッチ周波数とホルマント周波数の変化 [in Japanese](1968)

※9 日本人女性の声は、なぜこうも「高音」なのか(2018)

※10 ささやき母音のフォルマント構造(2000)

 ささやき声の音響分析と音声認識への応用(2001)

※11 小特集 一声質:音声言語の多様性に迫る一 音源から見た声質(1995)



おしまい

本記事では,男性の出す女声に焦点を当て,彼らが目指す成人女性の自然な発声を達成する為の手法確立の一環として音声から抽出できる音響特徴量とその音声に対する主観的評価を用いて総合的な評価を行う手法を提案した.ぜひ、役立ててほしい(?)

この記事が気に入ったらサポートをしてみませんか?