見出し画像

【夏休み科学Vtuber相談室x医師論文解説】録音された自分の声が違和感する理由が判明!? 自己音声シミュレーションの衝撃【OA】


背景

人は自分の録音された声を聞くと、違和感を覚えることがよく知られています。

この現象は、通常の聴覚と録音された声を聞く際の音の伝達メカニズムの違いに起因します。自分が話している時に聞こえる声は、主に骨伝導によるものですが、録音された声を聞く際は空気伝導のみです。

この現象は広く知られているにもかかわらず、自己聴取に関する研究はあまり進んでいません。その理由として、声帯から聴覚感覚に至るまでの経路が複雑であること、また生きている人間を対象とする研究であるため倫理的な制約があることなどが挙げられます。

本研究では、グラフィカルイコライザーを用いた知覚実験を通じて、自己聴取を測定することを目的としています。被験者が自己聴取と録音された声の聴取を一致させるようにイコライザーのスライダーレベルを調整することで、骨伝導音の周波数特性を決定できると仮定しています。

方法

  1. イコライザーの設計:

    • 8つの周波数帯域に対応するピークフィルターとシェルフフィルターのセットで構成。

    • 周波数帯域:150Hz, 300Hz, 600Hz, 1200Hz, 2400Hz, 4800Hz, 9600Hz, 22050Hz(ハイシェルフ)

  2. 実験ソフトウェア:

    • Cocoa GUIとSTK(The Synthesis ToolKit)を使用して開発。

    • 録音、フィルター選択、音声比較、設定保存の4つの主要機能を実装。

  3. 被験者:

    • 第1グループ:スタンフォード大学の学生8名(アマチュア歌手)

    • 第2グループ:ソウル国立大学の声楽専攻学生13名(プロの歌手)

  4. 実験手順:

    • 被験者は「ア」の母音で1オクターブ(8音)を歌い、4つの短文を話す。

    • 各サンプルごとに、録音された声にフィルターを適用し、自己聴取に最も近くなるようイコライザーを調整。

    • 合計12のイコライザー設定(歌声8、話し声4)を記録。

  5. データ分析:

    • 各被験者の選択したイコライザー設定から伝達関数を推定。

    • 特異値分解(SVD)を用いて伝達関数のモデル化を実施。

  6. モデルの検証実験:

    • 14名の新たな被験者(スタンフォード大学の学生)を対象に実施。

    • 2つのパラメータ(α, β)を持つ簡略化されたモデルを使用。

結果

  1. イコライザー実験の結果:

    • 被験者内での伝達関数の一貫性が高く、標準偏差は6dB未満。

    • 多くの伝達関数が300Hz〜1200Hz付近で強い増幅を示す帯域通過フィルターの特性を持つ。

    • 性別や歌唱経験レベルによる顕著な差は観察されなかった。

  2. モデリング:

    • SVDを用いて19人の平均伝達関数を分解。

    • 最初の2つの特異値が他と比べて有意に高いことを確認。

    • 2つのSVDフィルターを使用したモデルを開発し、さらに改良を加えて2パラメータモデルを作成。

  3. 検証実験の結果:

    • 14人の被験者による検証実験でモデルの有効性を確認。

    • ほとんどの被験者が自己聴取との類似度を80〜95(100点満点)と評価。

    • 検証実験で得られた伝達関数は、元の実験結果と類似しているが、ピークがやや低め。

論点

  1. 骨伝導特性との一致:

    • 本研究で得られた300Hz〜1200Hzの強調は、過去の頭蓋骨の共振周波数に関する研究結果と一致。

    • Franke(1956)の実験:乾燥頭蓋骨で800Hz、ゼラチン充填頭蓋骨で500Hzに共振を確認。

    • Pörschmann(2000)の実験:700Hz〜1200Hzの増幅と5kHz以上の急速な減衰を確認。

  2. モデルの簡略化と精度のトレードオフ:

    • 2パラメータモデルは操作が簡単になった一方で、元のイコライザー実験と比べてやや精度が落ちる可能性。

  3. 個人差の扱い:

    • 性別や歌唱経験による顕著な差が見られなかったことから、汎用的なモデルの可能性を示唆。

結論

  1. 自己聴取の伝達関数を推定し、300Hz〜1200Hzの帯域で強い増幅特性を持つことを確認。

  2. SVDを用いて2パラメータモデルを開発し、検証実験でその有効性を確認。

  3. 開発されたモデルは、性別や歌唱経験に関係なく適用可能で、操作が容易。

文献:

Won, Sook Young et al. “Simulation of One ’ s Own Voice in a Two-parameter Model.” (2014).

この記事は後日、Med J Salonというニコ生とVRCのイベントで取り上げられ、修正されます。

良かったらお誘いあわせの上、お越しください。

私たちの活動は、皆様からの温かいご支援なしには成り立ちません。

よりよい社会を実現するため、活動を継続していくことができるよう、ご協力を賜れば幸いです。ご支援いただける方は、ページ下部のサポート欄からお力添えをお願いいたします。また、メンバーシップもご用意しております。みなさまのお力が、多くの人々の笑顔を生む原動力となるよう、邁進してまいります。

所感

ここから先は

472字

¥ 100

よろしければサポートをお願いいたします。 活動の充実にあなたの力をいただきたいのです。