見出し画像

技術と人体構造から、「綺麗な声」を科学する。

あなたは、2011年5月8日に誕生したモテ声診断ツール「VQチェッカー」をご存知だろうか。

指定された台詞『素敵な声の人が好き』を読み上げるだけで、異性にとっての声の魅力"モテ声度" を示す「VQ」(Voice Quotientの略)を100点満点で計測。あなたの声は、どれだけモテるか!?
「面白法人カヤック」ホームページより引用


発表当時から声業界だけでなく巷でも大きな話題となり、最終的に累計約1,300万アクセスを記録した。このツールを制作した中心メンバーの一人が、東京工芸大学工学部准教授・森山剛先生である。

感情を含んだ音声の認識や合成、歌声の訓練支援ツールや自動合成、ナレーター訓練支援技術に関する研究を中心に行い「ヒトに気づきをもたらす技術」を軸として掲げる。今回はそんな【声の科学者】である森山先生に、ナレーターや声優のみならず誰しも一度は憧れる、「綺麗な声」についてお話を伺った。

森山剛(もりやま・つよし)/東京工芸大学工学部准教授。1994年慶大・理工・電気卒、1999年同大大学院博士課程修了、1999年東大生産技術研究所にて日本学術振興会特別研究員PD、2001年米カーネギーメロン大ロボティクス研究所ポスドクフェロー、2004年慶大助手を経て現在に至る。医歯工連携による健康寿命延伸に係わる研究、音・画像情報処理の研究に従事。


歌に捧げた学生時代を経て、声の研究者へ。


僕は埼玉県立川越高校出身です。男子校でしたが、文化祭に来る女子高生を楽しませようと僕の代の同期が始めたのが、男ばかりのシンクロナイズド・スイミング。それが「ウォーターボーイズ」の元ネタになりました。まさか映画化されるとは思わなかったな。

高校に入学して入る部活に悩んでいた時、母親が「合唱部が、全国で金賞を取るような学校なのよ。行くだけ行ってみたら」って。でも全然乗り気じゃなくて「じゃあ見学だけね」って渋々行ってみたら、100人近くの部員がいて、部屋が完全にハーモニーに包まれているんですよ。あと練習後の連絡の時間もキビキビしていて、大人に憧れる年ごろの僕にはすごく魅力的で。顧問の先生もダンディなバリトン歌手で、そういうのがすごくカッコ良かった。もう次の日から合唱団に並んで立ってました。中原中也の詩なんかを歌ってたんですけど、またその詩の世界が素晴らしくてね。

その後だんだん大学受験が近づいてきた時に、まず大学というものを「課外活動をするところ」と決めたんです。つまり、合唱が一番できるところ。川越高校って結構進学校なので、早稲田や慶應に進学するんですよ。早稲田には「グリークラブ」、慶應には「ワグネル」という男声合唱団があって、先輩たちの勧誘にのって演奏会へ行って虜になりました。そこでどちらかの合唱団に入るために早慶だけを受験したわけですが、慶應だけ合格しました。今考えると、雪降る慶應の試験日に発熱して鉛筆転がして何とか滑り込んだのは運命だったのかなと思います。

それで晴れてワグネルに入ったのですが、もう4年間歌!歌!歌!の日々で、息を吸っている時以外はずっと歌ってるような状態で(笑)音楽練習室にずっとこもって、そこから授業に行って、終わったらまた練習室に帰ってきて歌う。そういう生活を4年間ずっと続けて。それは常任指揮者の畑中良輔先生の求める音楽に応えるのに、訓練を十分と感じたことがなかったからでした。

ご夫婦での2012年ファミリーコンサートの様子。耳を潤わす美声はぜひYouTubeから聴いていただきたい!


そして大学4年生のときに、卒業研究テーマを選ばなくちゃいけなくなった。それで当時、フリッツ・ヴンダーリヒっていうテノール歌手がなんせ好きでね。その声の美しさについて研究したかった。それを先輩先生方に言ったらね、当時「綺麗」とかの感性情報は研究とみなされなかった時代で、もう大反対。でもそこは食い下がって。最終的には「声に含まれる感情をコンピュータが認識する」という研究に落ち着いたんですよ。

当時、松下温先生のネットワークの授業だったんですが、すり鉢状の教室で初日の開口一番バッと振り返ってね。「君たちは30年後を見なきゃいけない」って言ったんですよ。それが忘れられなくてね、ずっと底流にある。そこで研究テーマを選ぶときに、「これだけコンピュータが発展して人間と共にあって、ロボットなんかが暮らしに入るようになったら、やっぱり機械は人間の感情をある程度理解する必要が出てくる。感情はいずれ必要になるな」と考えたわけです。

ロボットはあくまで人間の感情を模倣するだけなんだけど、演劇の基本と一緒で、「こうやって喋っていれば多くの人が怒ってると受け取る」っていう、共有されたイメージがあるじゃないですか。そういう喋り方をコンピュータが真似する。そんな研究を、もう30年近く続けています。

東京工芸大学・厚木キャンパス 正面


良い歌と良い声には、2つの共通点がある。


歌と声には、良く聞こえる時の共通点があります。「イントネーション」「間」です。

まずイントネーションはね、音楽なんですよ。始めチョロチョロ中パッパじゃないけど、全体の展開があるでしょう。のべつまくなし一本調子に奏でる・話すのではなく、盛り上がりや緩急がちゃんと備わった演奏のような話し方をする。しかも、ときに多少淀んだり違和感を与えたりもする、不協和音的な要素も大事なんですね。綺麗な和音がずっと鳴ってることほど退屈なものはない。やっぱり人間って、変化しか感じない動物なんですよね。

あと一方で、最大の調味料は空腹だと感じます。「お腹すいた、食べたい」と思ってるから、一口食べたときに「うわー美味しい!」となる。声も一緒じゃないでしょうか。ずっといい声を聞きたい訳ではないと思うんです、お腹いっぱいになっちゃうから。例えば無口な男性がいて、ふとした瞬間にボソッと「寒いね」って喋ってくれる。それだけで、そのたった一言が嬉しい。波紋をあたたかく広げるわけですよね。沈黙があったから、そうなる。だから多分喋り方は、聞き手が今どういう状態なのか。ご飯を待ってるのか、もうお腹いっぱいなのか。そういったことを思いやって感じ取る必要がある。

要するにこちらが発する情報量がすごく多くて相手が処理中だと、プラスで喋ったって相手は飲み込めない。ちょっと待ってあげなきゃ駄目ですよね。反対に「どうなったんだろう?」って思ってる人は情報を待っているわけで、そこで「…それがですね、」なんて言うと、大きなインパクトになる。だから「良い声」「良い発声」っていうのを練習する人って、必ずと言っていいほど声を出す「オン」のところだけしか考えないんですけど、実は「オフ=間(ま)」の方が、大きな味付けをしてる気がするんですね。

研究室内には3畳ほどの防音室を設置。無形文化財である尺八奏法の自動識別に関する研究にゼミ生と共に取り組む。


「綺麗な声」のひとつの要素が、倍音。


倍音構造は「綺麗な声」の要因の一つになり得ます。声帯では左右のひだの間を呼気がバーっと通るんですが、物理学的に、流体(空気)が流れると、その流れる空気と接するもの(声帯の両側の膜)が、空気の方に向かって引き寄せられるんです。これを「ベルヌーイの力」と言います。例えば、2枚の紙を向かい合うように手で持って紙と紙の間に息を吹き込むと、それぞれの紙が流れる息に引っ張られてくっつくんですね。そして、声帯がくっついて閉じたところへ下からさらに呼気がきて押し上げるので再び声帯が左右に引き離される。

これを、男性だと1秒間に100回から150回、女性はその2倍ぐらいの200〜300回繰り返すんです。この開閉の頻度の違いが声の高さの違いになります。これは凄いスピードで、とてもじゃないですけど自分の意志で筋肉で動かして声帯を開閉することなんてできない。すべてが物理法則に従って自動的に行われるんです。

さて、ここからがさらにミラクルなんですが、声帯が開閉することによって様々な周波数の音波が作られて口や鼻、頭の中にバーッと響き渡るんですが、反射した音波同士がぶつかり合います。このとき、波動の性質で、少し周波数のずれた音波同士は互いに打ち消し合って減衰していくんですが、声帯の開閉の周波数(基本周波数と言います)のちょうど2倍、3倍、4倍…という整数倍の音波(倍音と言います)同士は強め合って生き残るんですよ。そして、生き残った音波だけが口や鼻から放射されて出てくる。

その、基本周波数とその整数倍の周波数から成る構造のことを「倍音構造」と言うんですが、人間はこのような構造をもった音を聴くと美しく感じます。なぜ心地良く感じるのか、その理屈はわかっていません。オーボエやフルート、トランペットといった管楽器はそういった音を作り出すために作られた道具ですね。

だから「綺麗な声だなあ」って感じる時、もちろん好き嫌いもあるけれど、多くの場合は倍音だけが鳴っている状態です。

森山先生独自のソフトで声を解析した結果の例。縦方向が周波数だが、倍音に相当するところに等間隔(整数倍)の縞模様が見える。


声帯がぴったり閉じて開いてを繰り返していれば、一つの基本周波数についての倍音構造になるからきれいな縞模様が見えるけれど、ちょっと喉に力が入ったり、喉がかすれて(声帯がボコボコに腫れて)隙間が空いてる、とかだと、声帯で発せられる音にノイズが混ざるわけですよ。そうすると、そのノイズも倍音を作る。今度はそれが雑音に聞こえたり、嗄声(枯れた声)の原因を作ってしまいます。だから声帯が充血しないよう、潤わせて良い状態に保つのは大切ですね。

森山先生ソフトの全体像
ソフト起動時に声を出すと、リアルタイムに周波数や音の成分を知ることができる


倍音を出すためには、プロの手を借りる。


自分独りで、綺麗な整数倍の音を出そうとすると難しいかもしれない。普段人は骨伝導の音(骨導音)と、口から出て空気を通って鼓膜を震わす気導音を同時に聞いているので、気導音だけだとどう聴こえるのか?は判断がしづらいんです。なので声のプロに聴いてもらって、倍音が出ている時の身体へ伝わる振動や、「いい声」の感覚を掴むといいんじゃないかな。トライアンドエラーのやりとりを繰り返すしかないと思います。

例えば、僕が歌うときなんですが、譜面には”ピアニッシモ”(ごく弱く歌う)とか、音量の指示がある。これをただ口先だけで小さく歌うと、薄っぺらい音になって全然スケール感がなくなっちゃいます。実は良い声が出ているときって、声が身体から完全に離れて、自分からではなく部屋の壁から聴こえるようになるんです。そういう、フォルテ(強く)を歌える身体でピアノ(弱く)を歌うというのは絶対に必要なんですね。それによって込められる、深みや世界観が変わってくるので。

でもその身体感覚は、人によって違う。頭では理解できても実現できるまでに使うイメージが違います。人によっては「ボールを100m向こうに投げる感じで」と言われると「なるほど」と腑に落ちる人もいるし、「地下50mに」とか言われると急にわかる人もいる。固有感覚というんですが、自分ならではのイメージの仕方を見つけるために試行錯誤が必要になるんですね。

東京工芸大学・厚木キャンパス正門 銘板


良い声に必要なのは、技術だけではない。


日本人は「すごい武器を持ったら完璧だ」みたいな、大艦巨砲主義が多いかもしれない。巨大な武器さえ手に入れれば戦争に勝つ、という。でも、すごい武器や技術を活かすには、そのための土壌やストーリーが必要だと思う。

知り合いで、赤ちゃんの泣き声をAIに学習させて、ミルクが欲しくて泣いてるのか、オムツを替えて欲しくて泣いてるのかを判定する機械を作ってる人がいます。とても便利だとは思うのですが、少し悩ましく思う部分もあって。

「なんで泣いてるんだろう」「どうして泣き止まないんだろう」と悩む過程が、とってもかけがえのない時間だと思うんです。ようやく泣いてる原因が分かったときに「そうだったんだ、お腹がすいてたんだね」と、それまでの悩みが、例えようもない安堵感や赤ちゃんへの愛情へと変化すると思うんですよね。そのやりとりは、後になって家族の微笑ましい思い出にもなっていくと思うんです。だから逆にその悩みを取り去ってしまったら、赤ちゃんへの愛情や家族の思い出はどうなっちゃうのかな?って。

人間って、かけたコストに対して無駄って思いたくない習性があるし、時間をかけるだけ思い入れが強くなる。ネット商店が訪問者の滞在時間を長くしようとするのはそういう理由ですよね。子育てと商売はもちろん違うけど、やっぱり関わって苦悩しながら諦めずに立ち向かっていく、その過程が大事だと思う。上澄みだけで簡単に問題が解決すれば、何の苦労もない。けれど、そうするとその分だけ思い入れが小さくなっちゃう気がしていて。

そもそも、ある目的があったときに、一発逆転大ホームランを入れましたっていう世界は、本当に幸せを生むんだろうか。今はとにかく簡単に良い結果を出そうとする時代だけど。誰もが苦労せずに良い声を出せるなら、そもそも良い声に価値がなくなる。今苦労して学んだり試行錯誤したりするっていうのが実はまさに正解で、その先に行く経過点一つ一つがいずれ自分の財産になる。

聴く相手の立場や媒体もその時々で変わるし、そうするとその都度学ばなきゃいけない。失敗もあるかもしれないけど、そうすると今度は前の自分とは違う自分になっていて、再びチャレンジする、っていうのを繰り返して。そういうのが自分の年輪になって、価値が増していくんだと思います。



これからも「HITOCOE」ではナレーターに特化した上質な記事を連載予定です。
今回の記事を気に入っていただけたら、スキやフォロー、サポート(投げ銭)を頂けると幸いです。いただいたサポートは、今後の活動費として役立たせていただきます!

東京工芸大学工学部准教授・森山剛(もりやま・つよし)

1994年慶大・理工・電気卒、1999年同大大学院博士課程修了、1999年東大生産技術研究所にて日本学術振興会特別研究員PD、2001年米カーネギーメロン大ロボティクス研究所ポスドクフェロー、2004年慶大助手を経て現在に至る。医歯工連携による健康寿命延伸に係わる研究、パターン認識、音・画像情報処理の研究に従事。博士(工学)、1998年電子情報通信学会学術奨励賞受賞、電気学会、情報処理学会、芸術科学会、電子情報通信学会、日本顎変形症学会、IEEE他各会員。

○著書:「レクチャー マルチメディア」…川崎洋,柳井啓司,佐川立昌,森山剛,古川亮,レクチャーマルチメディア,数理工学社,ISBN:978-4-86481-081-4,2022.3
○ホームページ:「森山剛 - 映像メディア研究室」
○Twitter:@tsuyoshi_37yo


ライター・日良方かな(ひらかた・かな)

都内FMラジオ局&Voicy「毎日新聞ニュース」パーソナリティー。ナレーターとして自宅に「だんぼっち」改造の録音ブースを完備し宅録にも対応。だんぼっち組立の様子をブログにしたところGoogle検索「だんぼっち 照明」で1位を連続獲得。「ハンドメイド」に特化したポッドキャストを毎月配信中。

○ホームページ:「ナレーター 日良方かな」
○Twitter:@hirakata_kana
○ポッドキャスト:「日良方かなのハンドメイド工房」


この記事が気に入ったらサポートをしてみませんか?