見出し画像

WEB会議の満足度は音声で決まる。失敗しないスピーカーフォン(マイクスピーカー)はヤマハ。

タイトルで結論を書きましたが、私は決してYAMAHAの回し者ではありません。しかし、以前WEB会議の販売推進をしていた立場としての最終結論がそれでした。

「遠隔会議」というくくりでその経験と知識のほとんどをさらけ出したサイトが下記ですので、興味ある方は、この記事を読んでいただいた後にでもご覧ください。

前回の記事では、「ヘッドセットマイク」を所有する重要性について説きました。

今回はその応用編ともいえる「マイクスピーカー(スピーカーフォン)の選択」についてです。

結局は音声品質が満足度を決める

「テレワーク」という言葉が使われるとき、文字通り離れた場所で仕事をするための環境があることが大前提となります。仕事するための環境として欠かせないオフィス機能の一つが、同僚とリアルタイムに意思疎通できる機会です。つまり「テレワーク」を成り立たせるためには、遠隔地間でコミュニケーションができるシステムが必須です。

「メールではなく対面で話しましょう」という言い方がありますが、相手の顔の表情から得られる情報の多さは認めるとしても、結局はテンポよく議論したいからその手段を取ります。また、最近はチャットツールの利用が盛んですが、報告が趣旨の会議ならまだしも、何かのアイディアを話し合ったり侃侃諤諤と議論するためのいわゆる「ミーティング」となればチャットではきついです。つまり、コミュニケーションするためのメディアとして映像や文字だけでは達成できることがとても限定されます。

一方で、声のみを伝達する電話が長きに渡って"テレコミュニケーション"の手段であったのは言わずもがなですが、その多対多を実現する「電話会議システム」も古くから存在し、今でも根強く使われます。音声情報は【人間の音声の周波数帯域の中で会話が成り立つ範囲】✕【ビット深度分】を送ることができるだけのネットワーク帯域があれば足り、それは映像に比べて遥かに小さくて済むため、ISDN時代からずっと現役です。つまり「テレワーク」で不便しないために相互伝達が必要なマルチメディアの中でも、音声情報は最も重要な位置を占めると言えるのではないでしょうか。

想像に難くないと思いますが、遠隔ミーティングの音声品質に下記のような問題が発生すると、とたんにミーティングは成立しなくなってしまいます。

・相手の声が小さくて聞こえない
・相手の声にノイズが入り明瞭度が低い
・自分の声が相手側の音響空間で反射して自分側にエコーのように聞こえる
・声の遅延が大きく、相槌がかみ合わない

このことは、人間が意思疎通をする上でいかに音声の微妙な特性で多くの情報を得ているかを再認識させます。しかしマルチメディアを売りとする現在の会議システムにとっては、音声偏重でカメラ映像や資料映像に手を抜くわけにもいかないので、過酷な事実です。

また、利用するほうとしては、スムーズなWEB会議進行の上で、映像に増して音声品質及び音響機器にこそ最大の配慮を払う必要があることを示します。

用語説明

今回の記事をスムーズに読み進めていただくために、いくつか用語説明をします。

・マイクスピーカー(スピーカーフォン)
自分の音を収拾し会議相手に伝送するためのマイクと、伝送されてきた会議相手の声を拡声するスピーカーの両方を持ち合わせた音響機器。机上に設置し、多人数で使うことが前提となる。
マイクとスピーカーが一体となった「一体型」と、それらが離れている「分離型」に大別できる。

一体型の例:

分離型の例:

・エコーキャンセル
部屋の壁や天井などに反射した音声(間接波)が声の直接波から遅れてマイクに集音されることによって聞こえるエコーを、フィルタで除去する技術。
エコーキャンセルをかけすぎると、直接波を誤ってキャンセルしてしまうため、チューニングは慎重にする必要がある。

画像1

・ボリューム自動調整
マイクで集音した音のボリュームを自動的に調整することで、遠くの人の小さな声を増幅したり、近くにいる人の声の音割れ(いわゆる「サチった状態」)を防いだりする。
自動調整によりマイク感度が上がりすぎると、本来増幅したくないノイズやエコーを大きく拾ってしまう可能性がある。

・音場
ここでは音響機器を設置する空間のことで、広さはもちろん、天井の高さ、壁の材質、置かれている物など、音波に物理的な影響を与える全ての要素を含めて指す。

・クロストーク
相手側と自分側の人間の両者が同時に発言した状態。後述の理由でいずれかの声が聴こえにくくなるのが通例。
マイクスピーカーの品質をみる上で、このクロストーク処理の上手さが会議の満足度に大きく影響を及ぼします。

・マイク指向性、集音範囲
一つ前の記事で解説していますので、心配な方はそこだけでも拾い読みして下さい。

マイクスピーカー(スピーカーフォン)のジレンマ

どうしてマイクスピーカーは簡単にいかないのか、動作の特性から考えてみましょう。

▪️ WEB会議が音響機器にあたえた苛酷

通常、コンサート・ライブ、または講演会などの場では、音響の専門家が事前にその会場の音響特性を把握します。

音源の種別は何か、機器をどう配置したらハウリングが起こらないか、マイクの感度やスピーカーのボリュームはどう調整したら聴衆に満足してもらえるか、そういったことを細かく調整して本番に備えます。
エンジニアがツーツーハーハー声を出したりノイズを出したりして様々な特性の音について入念にチェックします。

一方で会議用の音響機器はそこまでの段取りは踏めないことが当たり前です。

事前にマイク・スピーカー位置固定でプロが確認した会場であれば良いのですが、なにせWEB会議となると「手軽で簡単で場所を選ばず使える」ということがそもそもの売りにされるわけです。

WEB会議のその利点は、本来、音響機器としての理想的な使い方とは相反するものなのです。

▪️「会議」というシーンの困難さ

音響設計の大原則として

「自分のスピーカーから出した音は自分のマイクで拾ってはいけない」

ということを守らなければいけません。カラオケでもおなじみの「ハウリング」が起きないようにするためです。
つまり、自分の声がスピーカーから拡声されるのは良いとして、その音を更にマイクで拾ってしまうと、無限ループに陥ります。

画像2

そのため、なんらかのアルゴリズムで、自分のスピーカーからの音はマイクで拾ってもキャンセルする、またはそもそも拾わないようにデジタル制御がなされます。

そうなると問題は、クロストークが発生した場合です。

上記の通りハウリングの発生を抑止するために、スピーカ出力またはマイク入力いずれかをキャンセル処理した結果、それが誤って本来必要な音に対してなされてしまうと、互いにとって声が聞こえていない・途切れるという状態に陥ります

相手の発言の途中で質問しようとする人や、会話を遮る人、いるのではないでしょうか。

発表者が順番に発言して、QAは最後にまとめて、などというお行儀の良い会議ならば、無駄会議撲滅の昨今の風潮では、もはや事前に資料を共有した上でのテキストチャットでも十分です。わざわざ会議システムを使ってまでやる意味としては、本来の「会議」の真骨頂ともいえる、複数人でのフリートークや侃侃諤諤とした議論が重要なわけで、そうなると音響システムにとっては非常にシビアな状況といえます。

ハウリングの原理を理解すればクロストークの処理の難しさというのも理論的に納得できるものと思います。
つまり、自分が発言中に会議相手の話し声が自会場のスピーカーから出力されてしまうと、それを自分のマイクで拾ってしまっては相手に声が返ってしまうので、自会場マイク感度が下げられる(その結果、自分の声が相手に届かない)、もしくは自会場のスピーカー出力が減衰する(その結果、相手の声が聞こえない)という状況に陥るのです。

ならばなぜ私たちの誰もが使っている電話ではこんな問題が発生しないかというと、マイクとスピーカーが空間的に干渉しない位置にあるためです。

また、専用機のテレビ会議システム付属のマイクスピーカーはこのあたりの処理が段違いに優れています(※)。したがい「Ciscoのテレビ会議システムは問題なかったのに、Webex(Web会議)は音が悪くて使えない」という評価が下されることも珍しくないのです(ちなみにWebexもCisco製なので、メーカーの優劣ではないことがわかります)。

※専用機のマイクスピーカーは価格が桁違いです。同レベルの品質を求めるのは軽トラックに対してポルシェのように走れと言っているようなものです。それとWEB会議用の機器を比較するのは酷です。

▪️「一体型」マイクスピーカーの困難

「一体型」のUSB接続型マイクスピーカーのうち、集音範囲360°の製品としてWEB会議での使用実績が一番多いもののひとつに、ClearOne の chat150があります。

この製品のように、マイクとスピーカーが同一の筐体に収められている場合、マイクとスピーカーの距離は常に一定です。それによって後述の「分離型」と比較してキャンセル制御のための複雑な計算が軽減できるメリットがあると思います。

一方で、空間的に分離されていることで得られる音響的な手がかりというのがあるのですが(後で説明)、それが得られないため、キャンセル対象の判定は単純で「決めうち」の制御にならざるを得ません。また、本体スピーカーから発生するノイズや物理的振動からは絶対に影響を受けてはいけないので、それらの消去が何より優先されるでしょう。

そのため、一体型マイクスピーカーでクロストーク時の自然な聞こえを実現するのは困難を極め、WEB会議用として見合うような安価な製品でそれができるものは皆無だとあえて私は言い切りたいと思います。

▪️「分離型」マイクスピーカーの困難

一方でマイクをスピーカーから離れた好きな位置に置ける製品があります。YamahaのYVC-1000です。

先に結論から言えば、設置・運用上の問題がなければ、この製品さえ使っていば「音が悪い」という問題の多くが解決できます

マイクとスピーカーが空間的に分離していることで、自分のスピーカーからの音を認識できる物理的な手がかりのバリエーションが増えます。周波数特性、反響音の特性、位相特性などがあるでしょう。

それらの手がかりを用いて自分で放出した音の周波数特性・位相が空間を経てどう変化するかをあらかじめ把握すれば、スピーカーからの音にフォーカスしてキャンセルさせることも理論的には可能といえます。

こういった手がかりを駆使すれば、誤ったキャンセルによる音の途切れを軽減し、一体型よりもクロストークのような難しい状況でも違和感を緩和することが可能になるのです。

また、これは私の個人的な考えですが、「一体型」のような設計のしばりから解放されることで、スピーカー自体の音質もより聞きやすさを追求できるかもしれません。
つまり、一体型の場合は、本来はもっと低音を出したほうが自然な声に聞こえるけど、筐体に共振が発生してマイクに影響を及ぼすからできない、といった縛りがあるはずです。分離型のほうがスピーカーの音響設計の自由度が高まるのではないでしょうか。後述しますがこのYVC-1000はなんと他メーカーの任意のスピーカーを繋げることが可能ですが、それは推測を裏付けるものといえます。


さて、「困難」と記載した通り、分離型はメリットだけではありません。

マイクを自由な場所に設置できるということは、その都度スピーカーとマイクの位置関係が変わるわけですから、その位置関係をシステムが把握していないと、キャンセル処理がうまくいきません。

そこでYVC-1000では、マイクの場所を決めたのちに、「初期設定」が必要となります。
スピーカーからノイズ音を数回発生させてマイクで集音することで、音場の物理特性を把握し、自スピーカーから発せられた音がどのような特徴となるかを認識するのです。この作業には1分くらいかかったはずです。

しかし、そのように初期設定をしたとしても、マイクの場所を変えたら設定が台無しです。自分が話す番になってマイク手元に近づけるなど言語道断レベルです。

さらには、「初期設定」したときにはなかった物体がマイクとスピーカーの間に置かれたりしたら困ります。ノートパソコンを開いて壁を作ったりするのは厳禁。

下の動画はYamahaが公開しているものです。なぜか無機質なオフィスに不釣り合いな露出度高めの女性が説明しており説明が頭に入りにくいですが、ごく基本的な注意点を述べていますので、肝心の内容のほうをしっかり頭に入れておきましょう。

▪️会議が求める「指向性」がもたらす困難

もうひとつ、音響機器を困らせるのが「複数の人がいろいろな場所でしゃべる」ことです。

システムとしては、話者の声のみを相手に届け、雑音やエコーはキャンセルしようとして処理します。もし「マイクからみた話者の方向」が特定できれば、それがやりやすくなります。
マイクに指向性をもたせ、一番感度が高い位置に話者がいてくれれば、それ以外の角度からの音は減衰させることができます。

しかしながら実際の会議では、机を囲んで複数人が発言することが珍しくありません。したがい、集音方向360°をうたう製品である程度高級なものになると、単に360°すべての音を均等に拾うというわけではなく、リアルタイムに指向性を変化させます。簡単に言えば大きな音が入ってくる方向に対して感度を上げる制御をリアルタイムに行います。

ですが、あっちこっちから発言されると、指向性の自動調整が追いつきません。タイミングによっては本来拾うべき声が減衰させられてしまい、「なんだか聞こえにくい」という印象になってしまいます。

画像3

▪️実は使いどころが難しい「ボリューム自動調整」

用語説明でも述べた「ボリューム自動調整」は、「話者との空間的距離」を埋める機能です。マイクから離れた人の減衰した音声を持ち上げて、相手に聞こえやすくします。
マイクスピーカー自体のマイク感度調整として備わっている場合もあれば、WEB会議の機能としてソフトウェア的に実現される場合もあります。

一見便利そうなこの機能ですが、持ち上げる音が「発言者の声」であることを正確に検出するアルゴリズムが備わっていてこそ成立するものです。

「発言」とは関係ない遠くの雑音や壁からの反射音などは、データ処理で消去されるに越したことはないですが、ボリュームとしては大きくありませんから、もしそのまま相手に伝送しても実際のところ致命的なものにはなりません。相手にとっては「ちょっと雑音が聞こえるなぁ」というくらいのものです。
しかし「自動調整」によってその雑音が持ち上げられてしまったら致命的に邪魔になってしまいます

この「自動調整」は、場合によってデフォルト設定でONになっている場合も少なくありませんが、もし「音が途切れる」とか「雑音が入る」といった不具合が生じた際には、切り分けとしてまっ先にOFFにしてみる対象でした。
裏を返せばそれだけ弊害が考えられる機能だということです。

失敗しない音響機器の選択

いよいよ本題です。具体的にいくつかの製品について特徴を述べます。

▪️「一体型」先駆者 ClearOne chat150 の評価

まずは「一体型」の代表格として上でも挙げたchat150です。
これは限界を十二分に認識した上で使うならば選択肢の一つとなります。しかし私が知る限り、この製品では満足できずに買い換える、またはWEB会議自体をやめてしまうケースが少なくありませんでした。

クロストーク時の減衰や途切れが不自然な場合が見受けられます。
前述のマイク指向性の自動調整に対して利用者側の理解不足もあるものと思います。また、私がデモ用として複数台購入した際に、個体によって品質にバラツキもみられました。
chat150について詳しくは下記の別サイトに譲りますが、私個人の評価としては「素人には難しい商品」です。

一方、同じClearOne製品でも、集音範囲が前方120°で集音距離も短い chat50 という製品があります。これは集音範囲が狭まったことでだいぶ難から逃れたのか、上位のchat150よりも音質が良いというユーザーさえいました。
それほど空間の許容度を広げることは難しいのです。

1〜3人くらいのフランクな会議ならば、chat50で十分ではないでしょうか。

▪️「後発の利」Yamaha YVC-300(現行品は後続のYVC-330)

かつてYahamaにはPJP-50USBという製品があり、広い部屋でのWEB会議ではこれほぼ一択という時代がありました。決して悪い製品ではありませんでしたが、一体型だったということもあり、設定や調整が難しい製品でした。

また、10万円を優に超える高価な製品で、使う側の期待値も高く専用機並みの品質を期待したが故に、その差に愕然としました。

個人的には、「WEB会議は音が悪い」が一般認識となった元凶の一つではないかとさえ思っています。

それを反省(?)してYamahaが出したのが後に述べるYVC-1000という名機なのですが、その流れを汲み一体型でも従来製品をかなり上回る製品に仕上げてきたのがこのYVC-300です。(下のリンクは、現行機種の後続品YVC-330です)

この製品はchat150を意識して作ったものであることは明らかで、実際にヤマハの技術者からも、chat150は技術的に古い部分がありこちらのほうが優れると言われたことがあります(営業ではなく技術者ということで説得力がありました)。

この製品は単一指向性マイクが3つ内蔵され、360°対応とされます。
集音範囲は推奨で半径1.5mと狭めですが、最大3.0mということでその程度までは余裕で拾えました。3〜5人程度で机を囲んで会議するにはちょうどよいと思います。

WEB会議の救世主:Yamaha YVC-1000

そして「失敗しないマイクスピーカー」として私が一番に挙げたいのがYVC-1000です。(コロナの影響でずっと品切れでしたが、ようやく供給されてきました!しかも以前より安いくらいです)

既に口コミやレビューサイトでも賞賛されていますが、どうも評価のポイントが曖昧であったり環境依存の影響が排除できていない説明が多いような気がしています。この製品のすばらしい点は下記です。

1. 分離型でクロストークも大きな違和感がない

クロストーク時に音が途切れたり不自然な減衰があることで、人は「音が悪い」と感じます。このYVC-1000であっても、完全にお互いの発話がバッティングしてしまうと、明瞭な音声が届けられなくなります。
しかし、「大きな違和感がない」というのが主観的な感想です。

筆者は最も悪条件下のクロストークをエミュレートするために、いくつかの製品で以下のようなマニアックな実験をしてみました。

1. ルームA、BをWEB会議で接続。それぞれに同じマイクスピーカーを設置する
2.ルームAのマイク真正面にスピーカーを置き、iPodで英会話の音声を流し続ける
3.ルームBで人に文章を読み上げてもらい、ルームAでそれをどれだけ聴き取ることができるか確認する

画像4

その結果、YVC-1000は、英会話の発生タイミングによってBからの朗読音声の減衰が認められましたが、他の製品にみられたような「ブツブツ音が切れる」「ノイズのように聞こえる」といった現象は一番少なく、「同時に話したら聞こえにくいのは仕方ないよね」程度の感覚で見過ごせる程度のものでした。

ものによっては、英会話の一文が終わってブレイクが入っている間もルームBからの朗読音が途切れたままであったり、ブツブツと不自然に途切れる現象が発生し、とても気になるレベルでしたが、YVC-1000は「最大限マシ」と言えました。

2. 初期設定で、設置環境に応じた調整が自動で行われる

前述の通り、YVC-1000は「初期設定」が必要となります。
スピーカーからノイズ音を数回発生させてマイクを集音することで、音場の物理特性を把握し、マイクの位置関係を認識するのです。

この点は準備に時間がかかる点で前述ではデメリットとして取り上げましたが、この設定が必要な理由が理論的に納得できるのと、設置した空間に最適化してくれているという安心感が非常にポジティブに感じられます。

入出力レベルやエコーキャンセル強弱などのパラメーター、または本体の物理的な位置などを試行錯誤で変化させて最適解を得るような作業は、職人には楽しいかもしれませんが、一般ユーザーには苦以外の何者でもありません。(感覚論のようで、この「安心感」は実運用で非常に大事。

3. 拡張性が高く、比較的安価に拡張可能

「一体型」のマイクスピーカーでは、chat150にしてもYVC-330にしても、利用する部屋が広い場合にマイク集音範囲を広げるためには、本体を複数用意して連結させて対応します。そうなると問題は、本体の価格の倍数で費用が発生することです。

一方でYVC-1000は、専用機のテレビ会議システムのように、マイクの数を増やすことができます。マイクは本体よりずっと安く手に入ります。

従い、マイク一個付属のYVC-1000を買っておき、広い部屋に置きたければYVC-MIC1000EXを更につなげれば良いのです。
これは、十数万円した過去のPJP-50USBを2台3台買ったユーザーからすれば、反則級の便利さです。

4. 入出力とも外部機器との接続が可能

これがなにせ画期的でした。まず、外部スピーカーが接続できます。

前述の初期設定機能で音環境の測定ができることがそれを可能します。他メーカーの一般的なスピーカーであっても接続することができます。

また、外部マイクも接続できます

これにより、セミナー会場や展示会など、ステージ上の話者が講演・説明する場合にも使用でき、複数拠点同時講演や、遠隔地と中継してのデモが可能になります。
このご時世、大学の講義をリアルタイム配信するなんてこともあるでしょうけど、そのような用途にも使えます。

もちろん、そのマイクでスピーカー出力音を拾ってハウリングが起きないようにするためにはスピーカーとマイクの位置関係に留意する必要があり、場合によっては別途エコーキャンセラーと呼ばれる専用機材が必要になるでしょう。会場の特性や求めるレベル次第です。

まとめ:これに当てはまらなければ、YVC-1000 の一択!

ここまで絶賛してきたYamaha YVC-1000ですが、以下の場合には必ずしも最適な選択とはなりません。

・ パーティションで区切られただけのような部屋で使う場合
YVC-1000のマイク集音範囲は仕様表に最大5mとありますが、とにかくよく拾います。線路近くのビルでは電車の音が相手に聞こえてしまうくらいです。雑音が多いスペースには向きません。

・ 前方にスピーカーの設置場所がない場合
本体兼スピーカーはそれなりの大きさで、設置には場所をとります。それを会議室の前方に置くスペースが要りますので、常設できる場所がない場合は向きません。

・ 使うたびに機器を出し入れする必要がある場合
遠隔会議をやるときにだけスピーカーマイクを設置する運用となる場合、基本的にマイク位置が変わると「初期設定」が必要となるので不向きです。
ただしこの場合でも、初期設定したときのスピーカー・マイク位置にマーカーをつけておき、必ずその場所に置くなどして対処するユーザーもありました。

・ マイクを個別にミュートしたい場合
5個まで連結可能なマイクは、一つをミュートにするとすべてがミュートされます。つまり、「発言したい人の近くのマイクだけONし、他はミュートしておく」ということはできません。
しかしながら、もしその機能があったとしても、YVC-1000のマイクは集音範囲が広いために、たとえ直近のマイクがミュートされていても、ONされているマイクが部屋のどこかにあればそこから音が拾われてしまうでしょう。そのような失敗を想定して初めから機能を排除したのかもしれません。
もし各席の話者の付近のみマイクオンにしたいならば、下記のような集音範囲の狭いグースネック型のマイクを常設して都度ON/OFFするしかありません。

以上のようないくつかのケースに当てはまらないのであれば、私の意見としては「YVC-1000一択」とまで言い切りたいと思います。

価格は10万円を超えますので、予算が許さなければ小人数参加拠点にはYVC-330を入れたら良いと思いますが、たとえ1〜3人くらいの小規模な会議でも選択肢として考えるべきです。

ここまで言うのは、この製品ならばユーザークレーム受けることがほぼなかったという経験によりますが、付け加えて言えば、WEB会議メーカーがこの製品にもつ信頼性の高さも説得力を与えます。
V-Cubeのセミナーに行っても、WebExのセミナーに行っても、WEB会議のデモで使われているのはこの製品でした。「音が鮮明です」と説明されても、それはWEB会議の製品自体よりもYVC-1000のおかげじゃないかと思って聞いていたほどです。
それだけ、WEB会議関係者にとって欠かせない存在となっていました。私がいた会社の営業は、これしか売りたくない(ほかは必ずクレームになるがこれはならない)という人さえいました。

私が遠隔会議の仕事をしていたのはしばらく前なので、今は他にも高品質をうたうマイクスピーカーが出てきています。しかし今だに、ネットでの口コミ・レビューを含めても、この製品を上回る評価を得ている製品を聞いたことがないのです。

◎Web会議系の記事をまとめましたので、ほかも是非どうぞ:


この記事が気に入ったらサポートをしてみませんか?