見出し画像

新約 VRChat 始めて2年経ちそうなので女声についてまとめる~関係がありそうな論文まとめ~【 VRCHAT 】

Abstract(要旨・要約・概要)

本稿では女声が関連する研究にどのようなものがあるか簡単に紹介する。調査方法はGoogle Scholar(グーグル スカラー)にて特定のワード([MtF 声][MtF 訓練][女声 フォルマント])3つを検索にかけて収集する手法を取った。Ⅰに日本人を対象にした女声に関連する研究。Ⅱに海外におけるMtFの女性が行う音声トレーニングを示す。また、各論文の参考資料までは確認していない。

註:Google Scholar(グーグル スカラー)はGoogleが提供する学術文献検索エンジン。無料で利用でき、世界中のさまざまな分野の査読論文、学位論文、学術書などが見つかる。

調査日:2021年12月


Ⅰ 日本人を対象にした研究

音声訓練や治療の経過に関する論文

■男性から女性へ性別の移行を希望する性同一性障害者(MtF)
の発話音声の分類に関する試案
▶この論文はMtFの発声音声(作り方・出し方)を分類することを目的としたものである.著者らはMtFに対し声を女性化させるための transsexual voice therapy(TVT)を行っており,17歳から78歳までを含む230名のMtFから収録した音声データを用いて発話音声と性的指向・生活背景との関係性を導き出した.その関係性を元に以下の6項目に分類している.(1)性的指向による分類(2)日常生活とテクニックによる分類(3)環境要因の影響による分類(4)声の高さ(5)声の上げ方(6)典型例

https://www.gavo.t.u-tokyo.ac.jp/~mine/paper/PDF/2007/SP2006-160_p1-6_t2007-3.pdf

■男性から女性へ性別の移行を希望する性同一性障害者(MtF)
の音声訓練 : 症例報告
▶音声治療・訓練を行うにあたり,その訓練の有効性を検証する必要がある.そのため,訓練前後の声を第三者による評価・ 患者本人の満足度・話声位のF0(基本周波数)の3点の変化をもって比較した.その結果,二か月の訓練で聴者の約9割から女性と判断され,患者自身も満足し,F0(基本周波数)は成人女性平均値に移行した.(内容の確認が出来ないのでアブストラクトを要約)

■性同一性障害Female to Male症例の男性ホルモン投与による話声位基本周波数の継時的変化
▶FtMは男性ホルモン投与で声が低くなり男性的になることが経験的に分かっている.MtFは声の女性化のために積極的な治療が行われるのに対し,FtMは自然とピッチが下降し治療を必要としない.そのため,音声に関する報告が少なくどのように低下するのかが不明瞭だ.そこで男性ホルモン投与中のFtM 23例を対象に話声位のF0(基本周波数)を継時的に測定しその変化を解析した.測定頻度は1ヵ月・2ヵ月・3ヵ月・6ヵ月・9ヵ月・12ヵ月が経過した時点で行っている.その結果,1ヵ月経過後から3ヵ月経過後までに急激な低下がみられ,6ヵ月後以降はほぼ安定することが確認された.


根本的なフォルマントに関する論文

■母音のフォルマント分析 : 過程と仮定を知る(やさしい解説)
▶やさしい!(やさしくない)

■合唱のためのフーリエ音楽学:母音を構成する倍音群の解析
▶やさしくない!


女声の判定に関する論文

■女性と判定された性同一性障害者(MtF)の声の基本周波数 [in Japanese]
▶本論文は,MtFが行う音声訓練法を確立するために日本文化圏で女声と判定される基本周波数(F0)の範囲を検討したものである.その結果,80%以上が女性と判断されたMtFのF0の範囲は180~214Hzであり平均は193Hzとなった.これは欧米の先行研究よりも高い値である.逆に180Hz以下では男性と判断される率が高まった.(内容の確認が出来ないのでアブストラクトを要約)


■女性と判定される声の特徴——性同一性障害者の話声位——
▶transsexual voice therapy(ボイスセラピー)において,女性の声に聞こえる最適な声の高さを検討し訓練ターゲットとする必要がある.そこでMtF119名と生物学的女性32名の母音発声と朗読発声の音声データを実験内容を知らされていない学生(男性109名、女性191名)に聞かせ,判定された性別とF0との関係を調べた.その結果以下のことが判明した.(1)MtFの女性判定率良好群の平均F0は朗読では217Hzと欧米より高かった.(2)平均F0値は,母音と朗読で有意に差があり,朗読のほうがF0値は低い傾向にあった.(3)聴取実験において,女性判定率良好群のF0は生物学的女性に比べて,母音では有意に高くなり,朗読では有意差が無かった.(4)MtFでは,女性判定率とF0値との相関が女性判定率70%までは有意であるもののそれ以上では有意ではなかった.(5)生物学的女性と同じF0値にあっても,女性の声と判定される率が低いMtFの発話があり,高さだけが女性判定に必要かつ十分な要因ではない事が示唆された.



■連続発話音声中に含まれる男声・女声知覚に寄与する音響特徴量
▶本論文では,連続発話音声中に含まれる音響的特徴量を静的な特徴,および動的な特徴に分類し,これらがどのような順序で男声・女声知覚に寄与しているのか明らかにすることを目的とする.そのため、まずは男声・女声の音声に違いがあるのかまた違いのあるパラメータを特定する為にMDS分析を行い,そこで得られたパラメータが男声・女声判別にどのような影響を与えるのかを調べた.その結果、男声・女声判別には静的特徴である平均基本周波数(F0)とスペクトル包絡が大きな影響を与えており,次いで,動的特徴である基本周波数(F0)の変化と音韻長が影響を与えており,スペクトルの変化とゲインのダイナミックレンジはあまり影響を与えていないことが明らかになった.

※プチ補足
静的特徴 「あー」発声時の様な変化しない特徴。
動的特徴 会話する時などに変化する特徴。 
スペクトル包絡 声のスペクトル波形を単純にしたような1本の線のあれ。フォルマントは点の情報であり、こっちはパターン形状から全体の特徴を捉える事が出来る。
基本周波数の変化 抑揚のこと。
音韻長 母音、子音などのまとまり。この研究では語尾を伸ばす事で表現。
ゲインのダイナミックレンジ 声の大きさ。

https://dspace.jaist.ac.jp/dspace/bitstream/10119/4356/5/paper.pdf


■話者認識技術を用いた性同一性症者(MtF)の音声に対する男声度・女声度の自動推定とその臨床応用
▶本論文は話者認識技術を用いて知覚的女声を推定するシステムの臨床応用について検討したものである.このシステムは声道特性と音源特性を要素として持つ男声モデル・女声モデルを持ち,入力音声をそれらモデルに当てはめて女声度を推定.知覚的女声度(人による聴取実験により求められる女声度)の予測値を算出する.実際に上記システムを臨床で用いた結果,声道形状を変えながらピッチを上げて女声を作る手法の完成度を知ることはできた.しかし,声が低く女らしい話し方をする事で9割以上の聴者に女性と判定される場合などのような動的特徴による女声の生成には対応できなかった.


■スーパーベクトルとSVRに基づくMtF話者のための女声度推定
▶むずかしい!


女声の表現に関する論文

■女性声優の演技音声にあらわれるジェンダーの表現
▶本論文は,同一の女性声優が演じる男性役と女性役の音声を比較することで,性別のイメージが音声にどのように反映されるか明らかにすることを目的にするものである.実験には声優の緒方恵美氏が男性役と女性役を演じるドラマを収録したオーディオCDを使用.まずは14名の大学生を対象に聴取実験を行い,役割上の性別が聴覚印象上でも区別されている事を確認する.次に台詞中から男性役・女性役それぞれの母音を抽出,音響解析を行い母音のフォルマントを比較した.その結果,母音のフォルマントには演じる役柄の性差が第2~3フォルマントに大きく反映されており,現実における声の男女差にある程度類似していることが観察された.ただしその類似性は部分的で,第1フォルマントではほとんど役柄の性差による違いが見られず,母音/a/の第1フォルマントに至っては現実の男女差と正反対の傾向が観察された.これらの特徴は,男女がもつ声の生理的な特徴を演出している部分と,ジェンダーに関することば・イメージの両方を反映している可能性がある.また,男性役で男性らしさが表現されているだけではなく,女性役で女性らしさも誇張して表現されているのではないかと指摘している.


声の印象に関する論文

■女性の声を例にした音響的特徴量と印象評価の関係性の調査
▶メラビアンの法則では他人に与える影響の約4割を声色の印象が占めると考えられている.しかしながら,どんな声がどんな状況でどんな個人性を持つ他人にいい印象を与えるのかは不明瞭である.そこで著者は12名の聴者を対象に20代女性29名の単語音声を用いて聴取評価を行い,その後「いい声」の音響的特徴量を調査した.調査の結果,聴取評価より大多数が「いい声」と感じる声には「感受性が豊かである」「華やかで賑やかである」「社交的で穏やかである」の項目で肯定的な評価がされるという共通点があり,音響特徴量的には基本周波数の平均値,単位時間枚のフレーム数,フォルマント周波数の頂点数が要因にあると仮説を立てている.


■政治家の印象形成における声の高低の影響:音声合成ソフトを用いた女声による実験研究
▶本研究の目的は、政治家が提供する非言語情報のうち政治家の「声」の高低に着目し、声の高さが印象形成にどのような違いをもたらすか調べたものである。実験方法は大学生74名(男性43名・女性31名、平均年齢18.91歳)に対し、聴取実験を行い「好感度」と「信頼度」を0(最も低い)~100(最も高い)までの間で評価させた。使用した音声データは音声合成ソフトを用いて声の高低を操作した4職種に関するセリフ(政治家・車掌・F.A.・看護師)の音声データを用いた。なお音声データは全て女声で作成し、男性社会における女声、女性社会における女声について検討した。その結果、低い声が「好感度」と「信頼度」の評価を高め、高い声は逆に評価を低めることが示された。次に話者の職業では、職業威信が相対的に高い職業でより低い声が求められる傾向が確認され、上記の結果は本研究で設定された職業のうち、職業威信の最も高い政治家において顕著であることが確認された。

https://rikkyo.repo.nii.ac.jp/?action=pages_view_main&active_action=repository_view_main_item_detail&item_id=12058&item_no=1&page_id=13&block_id=49

■音声中の母音の明瞭性が話者の性格印象と話し方の評価に与える影響
▶顎の開閉や舌の前後位置などにより母音の音響的なコントラスト(明瞭性)は変化する。この変化の結果は話者の人柄に関するイメージにはどのような影響を与えるのだろうか。そして,音韻的な情報による伝達精度の向上は,話し方そのものの心理的な評価に対してどのような効果をもたらすのだろうか。
本研究は,音声に含まれる母音の明瞭性に着目し,音響的コントラストの大きさが性格印象に与える影響を計測した。(実験1)また,母音の明瞭性と話し方の特徴に対する心理的評価の関係性についても検討を行った。(実験2)実験1では,男声2名・女声2名から収録した音声に含まれる母音の明瞭性を操作した音声データを用いて大学生36名に対しBig Fiveの5つの性格特性を各項目10段階で評定してもらった。その結果、「勤勉性」・「協調性」に有意な差があった。実験2では、先ほどとは別の大学生35名に対し、同じ音声データを用いて話し方の特徴に関する5項目(自然性・流暢さ・好ましさ・活発さ・丁寧さ)を評定してもらった。その結果、自然性・流暢さ・好ましさの3項目で有意な差が見られた。
総括として,母音の明瞭性が高い方が,勤勉で計画性があり,きちんとした性格の印象を与えることが示された。また母音の明瞭度が原音声よりもやや高い場合に,協調的で温和な人柄の印象が最も高まることがわかった。

■発声器官としての声道サイズが話者の性格印象に与える影響
▶本論文は,体躯の大きさと緩やかな相関が想定される声道のサイズと,声道を通過することで特徴づけられる声質から想起される性格印象を調査したものである.調査方法は大学生36名を対象に音声を提示し,Big Fiveの5つの性格特性を各項目10段階で評定.音声データは男声2名・女声2名の声を加工し声道サイズの違いによって生じる声質の違いを再現している.その結果,声帯サイズの小さい音声の評価が高いことが分かった.声道サイズ要因で「外向性」「経験への開放性」が5%水準で有,「勤勉性」「協調性」が10%水準の有意差が見られた.




Ⅱ 海外で実施されてるMtFが行う音声トレーニング


transsexual voice therapy(トランスセクシャル ボイス セラピー)について触れてる論文もあったので参考程度にWikipediaより引用する。(要約引用者)Transgenderとあるが、Transgender(トランスジェンダー)はこころとからだの性が一致していない人、transsexual(トランスセクシャル)は性転換した人を意味する。海外版は出典がしっかり書いてあるので日本版より信憑性が高い。


トランスジェンダー全般に関する音声治療技術として、Davies and Goldberg(2006)はトランスジェンダーが発する声の女性化と男性化の両方で使える治療技術を以下のように提案している。

1)日常生活で観察される非トランスジェンダーの人々の模倣。
2)良好な声質を維持しながら徐々に複雑な発声練習へ発展させる。
3)声域と声質を維持するための声の柔軟性の練習。
4)モータートレーニング。
5)咳をするとき、笑うとき、喉を鳴らすときの声の質を識別し、変化させる。
6)さまざまな声のスタイルを試してみる。


また、トランスジェンダーの声を女性化するステップとして以下の手順があげられている。トランスジェンダーの音声療法ではピッチの上げ下げに焦点を当てて治療が行われている。

1)セラピストと相談の上、患者が普段話す時の基本周波数を決定する
2)次に、セラピストと患者は通常女性とみられる許容範囲(平均的な女性の声のピッチ範囲に基づく社会的に許容できるピッチ)に基づいて、目標ピッチを決定。※この時、緊張や過度の負荷がなく出せるピッチに設定。
3)目標ピッチは治療が進むにつれ最終的なピッチに到達するまで徐々に上げる。また、慣れないうちは目標ピッチで母音発声を維持し、次第に2〜5分の会話が出来る事を目指す。


半閉塞声道(SOVT)

高音域での発声を容易にするために、半閉塞性声道(SOVT)技術が使用されることがあります。SOVT法には、ストローを唇に挟み発音する、タングトリルをする、鼻音(/m/ /n/)・有声摩擦音(/z/ /v/)・高音母音(/u/ /i/)などの複数の音声を出す、などがあります。よく使われる練習方法は、中音域から高音域に向かってピッチグライドを出す練習と、柔らかい声から大きな声になり、再び柔らかい声になるメッサ・ディ・ボーチェの練習です。SOVTのテクニックでは、個人が高いピッチで声を伸ばすことで、習慣的ではない高いピッチでの声の出し方を簡単かつ効率的にすることができます。

ストロー発声の補足
日本では普及していませんが、海外では音声治療によく使われているようです。英国で活躍する歌手サムスミス(Sam Smith) 声帯出血の治療にも用いられました。
・3分でわかる、歌う前にするとグンと声が出るウォームアップマジック!
https://www.youtube.com/watch?v=rES0W1KSOo0
音声学者であり、ユタ大学の非常勤教授・アイオワ大学の特別教授としても教鞭をとっているIngo Titze博士(インゴ・ティッツェ博士)による解説
https://www.youtube.com/watch?v=0xYDvwvmBIM&t=156s
自分で行う医学的ボイトレ(音声治療)

共鳴腔の操作

また、声の共鳴を利用してピッチを変化させることもできます。声道の長さが声道の共鳴に影響を与え、それがピッチに影響を与えます。男性は女性に比べて声道の長さが10~20%ほど大きいため、男性は女性に比べて声道の共鳴が低く音程も低くなります。声道の長さを変えると共鳴やピッチが変化します。トランスジェンダーの女性は、唇を引っ込めるなどのテクニックを使って声道を短くし、より女性らしい声を出すことができます。

この記事が気に入ったらサポートをしてみませんか?