頭部伝達関数とは?(1) ~自宅で伝達関数を計測してみた~
GACKTが間違えない『格付けチェック』シリーズでは、プロの演奏とアマチュアの演奏を比較して、どちらがプロの演奏か当てる問題がある。何人かの出演者が一緒に聞いているときに、音楽グループの方がプロの演奏の方を当てられないことが多々ある。
一緒に聞いているにもかかわらず意見が分かれるのはなぜか?1つの理由に「プロの演奏を聞いた経験の違い」が挙げられる。「経験」は重要な要因で、プロの演奏を知らない人は「これがプロだ」と判定するより、自身の経験上、「アマチュアと思われるほうがAだから、プロはBだと思う」というように判定するほうが正解する可能性が高いのかもしれない。
「経験」以外の要因は何があるだろうか?「音量」、「テレビの機種(PanasonicのVIERA?SHARPのAQUOS?SONYのBRAVIA?REGZA?)」が原因だろうか?近年ではTVerのようなアプリでPCあるいはIPad、スマートフォンで試聴しているかもしれない。原因は様々考えられるが、今回は、少し理系的なキーワードである「頭部伝達関数」について考える。
1. 頭部伝達関数とは?
音の変化と頭部伝達関数
「頭部伝達関数」は音響工学の基本キーワードである。音響工学の教科書『空間音響学』(飯田一博,森本政之編著,コロナ社)の頭部伝達関数の説明のイントロには以下のように書かれている。
また、Wikipediaの「Head-related transfer function」(頭部伝達関数)の冒頭では以下のように書かれている。
この英文の大まかな意味は以下の通りである。
「頭部伝達関数は音源から発せられる音を耳がどのように受け取っているかを表現したものである。音は聞き手に到達すると、聞き手の頭部や耳の形状、大きさ等の影響を受けて変化する。この音の変化は、最終的に聞き手の耳にどう到達するか、聞いた音をどう知覚するかに影響する。」
音は音源から四方八方に拡散し、空間内の様々なものにあたって反射し、最終的に耳まで到達する。複数の経路を伝播して音が耳まで到達するとき、音の干渉が発生し、ある周波数では音の強め合い、別の周波数では音の弱め合いが発生する。その結果、スピーカーから再生された音と耳に到達した音の特性は別物になる。音自体が別物になったのではなく、スピーカーから再生した音とマイクで録音した音を比較すると、同じではなかった(=変化した)ということである。
この「音の変化」は、(1) どの方向から音が耳に到達するか、音源との距離、部屋の性質(音が反射しやすい壁か否か)など音源と耳がある空間の特性に依存する。また、(2) 頭部の大きさや耳の形状にも依存する。「音の変化」の要因自体は1つではないが、私たちは普段の生活の中で「音の変化」の情報から、音源と耳の空間配置や空間の特性などを把握して役立てている。頭部伝達関数は、私たちが生活の中で感覚的にとらえている「音の変化」を定量的に記したものである。この記事を読む際は、「頭部伝達関数=音源から音が発せられてから、耳に到達するまでに音がどう変化するかを表す量」とラフなイメージを持っていただければ十分である。
(補足)音の伝播経路
音の伝播経路には以下の複数の経路がある。
(1) 音が頭部の近くに到達するまでの経路は複数ある。特に、②の何かに反射してから到達する経路は、多数存在する。(図1にイメージ図を示す)
①音源から直接頭部の近くに到達する経路(最短経路)
②室内のもので反射してから頭部の近くに到達する経路
(2) 頭部の近くまで音が到達すると、頭部や耳の形状に起因する反射が発生し、耳の鼓膜に到達する複数の音の伝播経路が発生する。
『空間音響学』(飯田一博,森本政之編著,コロナ社)や『頭部伝達関数の基礎と3次元音響システムへの応用』(飯田一博,コロナ社)では、上の(2)の経路において、最終的に音がどう変化するかを表す量を頭部伝達関数として定義しており、数学的には、(1)と(2)の両方による音の変化から、(1)による音の変化を差し引く形で定義されている。ただ、本記事では、上の(1)の経路も含めて、音が発せられてから聞き手の耳に到達するまでの総合的な音の変化のことを頭部伝達関数と呼ぶことにする。(1)の経路を伝播する際の音の変化は、聞き手の位置が同一であれば、聞き手の違いが影響しない。そのため、(2)の経路を伝播する際の音の変化だけで頭部伝達関数を定義することと、(1)と(2)の両方の経路を伝播する際の音の変化から頭部伝達関数を定義することは同一である。
頭部伝達関数の個人性
頭部や耳の形状は個々人によって異なるため、頭部伝達関数のうち、頭部や耳の形状に起因する反射、それによる耳の鼓膜に到達する複数の音の伝播経路に起因する部分には個人差がある。同じ音源を同じ位置で聞いていても、音の聞こえ方(=物理的に耳に入る音の特性)は個々人で異なる。その結果、感覚的な意味での聞こえ方にも影響することが報告されている。実際、音響工学の教科書には「他人の頭部伝達関数の情報を使用すると、定位感覚の精度が劣化する(実際に音が鳴っている方向とどの方向から聞こえると感じたかの差が大きくなった)」など各種研究結果が記されている。
2. 自宅で伝達特性を計測してみた
第1章で頭部伝達関数の概要を記した。第2章では簡易的な実験系で伝達関数の計測を試みた結果を記す。
実験環境
図2に実験環境を示す。自宅のテレビ台の上にスピーカーを置き、スピーカーと向かい合う位置にマイク(SENNHEISER XS1)を設置した。その他、スピーカー、オーディオインターフェース、マイクアンプなど必要資材を取り揃えて実験を行った。(ちなみに、この実験を実施するために購入した必要機材の値段は総額で5万円近くだった…)
スピーカーとマイクの距離を10cm、20cm、…、80cmと10cmずつ変えながら、スピーカーからTSP信号を再生し、マイクで録音した。その後、PCでデータ処理をして、スピーカーとマイクの間の伝達関数(スピーカーから音が発せられてから、マイクに到達するまでに音がどう変化するかを表す量)を取得した。
背景雑音の振幅レベル
図3にマイクで録音した信号の振幅レベルを示す。図3の赤線は、スピーカー・マイク間の距離を80cmにした場合の、TSP信号を再生した際のマイクで録音した音の振幅レベルを表す。青線は、実験前にスピーカーから何も再生せず背景雑音を録音した際の振幅レベルを表す。背景雑音は1kHz以上でTSP信号より15dB以上低かった。実験の初めから終わりまで、熱中症対策のために付けていたエアコンの駆動音が聞こえたが、バイクやサイレンの音などは聞こえなかった。背景雑音は254Hzで振幅レベルが非常に大きかった(5kHz以上と比較すると20dB以上大きい)。背景雑音の録音データは、サーというホワイトノイズのような音に、カラカラと機械の駆動音が混じっていた。254Hz成分はこのカラカラ音と思われる。
伝達関数の計測結果
図4にスピーカー・マイク間の距離を10cm、20cm、40cm、80cmとした場合のスピーカー・マイク間の伝達関数を表す。伝達関数を計算する際は、背景雑音の周波数特性を考慮し、録音データにカットオフ周波数300HzのHPFを適用してから計算した。図4より、マイクがスピーカーに近いほど振幅レベルが大きいことが確認され、簡単なセットアップであっても、物理的には妥当な結果が取得できたと考えている。
図4から以下の特徴を確認できる。
2~3kHzの間と6~7kHzの間にピークがある。
5kHz付近で振幅レベルが小さくなる(ノッチがある)。
ピークやノッチの周波数はスピーカーとマイクの距離によらずおおよそ一致した(おおよそ一致したが、距離によって微妙に異なる)
ピークやノッチの周波数は、スピーカーとマイクの距離によらずおおよそ一致したが、距離によって異なっていた。この結果は、スピーカー・マイクの距離が変わると、床や机での音反射の経路が変わることなど、音響機器の空間配置の違いも反映されている。
ピークやノッチの周波数が距離に関係なくおおよそ一致しているため、この伝達特性による(感覚的な意味での)音の聞こえ方の変化は、おそらく音量の違い(スピーカーからマイクが離れるほど音量が小さくなる)だけと筆者は予想する。図4の特性によって聞こえ方がどう変わるかをシミュレーションを実施した結果を、次の記事で記すことにしよう。
本記事の内容についてコメント等がある場合は、noteの記事に対する感想の書き込み機能やコメント機能で教えていただけますと幸いです。
参考文献
『空間音響学』飯田一博,森本政之編著,コロナ社,2010.
『頭部伝達関数の基礎と3次元音響システムへの応用』飯田一博,コロナ社,2017.
Head-related transfer function - Wikipedia:https://en.wikipedia.org/wiki/Head-related_transfer_function
この記事が気に入ったらサポートをしてみませんか?