見出し画像

Dolby Atmosを徹底解説!(前編)

2023年6月よりLive ExtremeでDolby Atmosの配信に対応しました。数ある立体音響技術の中でも、対応サービスやコンテンツの数、再生環境ともに最も充実していますが、劇場用と家庭用の仕様に違いがあったり、対応コーデックが複数あったりして、その全容を理解するのはなかなか困難です。今回は家庭向けインターネット配信に焦点を当てつつも、Dolby Atmosの全体像について技術解説していきます。


Dolby Atmos® (ドルビーアトモス)とは

米Dolby Laboratoriesが開発した立体音響技術。従来のサラウンド方式 (5.1ch, 7.1chなど) では、リスナーと同じ水平レイヤーのみにスピーカーが配置されていましたが、Dolby Atmosでは、頭上方向にもスピーカーを加えることで、左右前後だけでなく、上下方向の空間表現も可能になりました。

Dolby Atmosのイメージ [参考文献1より]
Dolby Atmosロゴ

2012年に公開された PIXAR による3Dアニメーション映画「メリダとおそろしの森 (Brave)」が、Dolby Atmosを採用した初めての作品で、以後多くの対応映画が制作されています。

オブジェクト・ベース・オーディオ

大きな映画館、小さな映画館、ホームシアターで、設置できるスピーカー数は全く異なります。また、ステレオと5.1chサラウンドのみに対応すれば良かった時代と異なり、スピーカー数とそのバリエーションが増えるにつれ、制作者がそれぞれのスピーカー・レイアウトに合わせた別ミックスを作るということが現実的でなくなってきました。そこで、再生スピーカーの数に依存しない音声記録方式として考案されたのが「オブジェクト・ベース・オーディオ」です。

オブジェクト・ベース・オーディオのイメージ

オブジェクト・ベース・オーディオは、

  • 物体の発する音 (モノラルPCM)

  • 物体の三次元位置情報 (メタデータ)

を個別に記録し、再生時にスピーカー・レイアウトに応じてレンダリングする方式です。オブジェクト(飛行機の音など)が移動する時には特に効果があり、スピーカー数が増えるほどに、より緻密な動きを再現できます。

オブジェクト・ベース・オーディオのレンダリング [参考文献2より]

Dolby Atmosの制作フォーマット

オブジェクト・ベース・オーディオのアドバンテージは理解できるもの、この世界には、ホールの響き、街の喧騒、森の環境音など、音源の位置情報をはっきり記述できないもの存在します。このような音は、従来のチャンネル・ベース・オーディオの方が親和性が高そうです。

オブジェクト・ベース・オーディオとして紹介されることが多いDolby Atmosですが、制作段階では、チャンネル・ベース(=ベッド・チャンネル)とオブジェクト・ベースの両者に対応したハイブリッド方式となっており、マスターファイルには、7.1.2chのベッド・チャンネルと、118個のオブジェクトの計128チャンネルを収録することができます。サンプルレートは48kHzと96kHzに対応しています。

Dolby Atmosには、後述のように様々なバリエーション(圧縮フォーマットやスピーカー・レイアウト)が存在しますが、全てに共通しているのが、上記制作フォーマットであり、結局のところDolby Atmosとは制作フォーマットである、と考えるのが自然です。

劇場用Dolby Atmos

Dolby Atmos対応の映画館には上記128チャンネルのマスターをそのまま再生できる設備が導入されています。対応するスピーカー数は最大64個で、下図のように天井に2列のスピーカーを配置することができます。Dolby Atmosレンダラーは、会場のスピーカー・レイアウトを考慮して、オブジェクトをリアルタイムで各スピーカーにアサインしていきます。

映画館におけるスピーカー設置例 [参考文献3より]
Dolby Atmos Cinema Processor [参考文献3より]

家庭用Dolby Atmos

同じDolby Atmosマスターを使って、家庭でも映画館と同様の体験を提供するという試みが「Dolby Atmos for Home」です。当然、映画館とホームシアターでは、規模感も掛けられるコストも変わってきます。そこでポイントとなってくるのが、オブジェクト数やスピーカー数の制限と音声圧縮技術なのですが、実は利用場面や目的に応じて複数の手法(コーデック)が存在しています。

ここからは、Live Extremeでも利用している「Dolby Digital Plus」というコーデックを中心に、家庭用Dolby Atmosで利用されている技術について解説していきます。

Dolby Digital Plus™ におけるDolby Atmos

動画や音楽のストリーミング・サービスで配信されている Dolby Atmos は、殆どの場合「Dolby Digital Plus」(Enhanced AC-3とも呼ばれます) というコーデックで提供されています。Dolby Digital Plusは2005年に発表され、Blu-ray Discにも採用されたロッシーな音声圧縮フォーマット(最大7.1ch)ですが、2016年に仕様が拡張され、立体音響にも対応しました。

以下に、Dolby Digital PlusにDolby Atmosによる立体音響を収録する方法を紹介します。

Spatial Coding

Dolby Atmosマスターに含まれる128チャンネルもの音声をリアルタイムでレンダリングするのは、処理負荷が高すぎるため、家庭用の民生機では現実的ではありません。パッケージ・メディアの容量や回線速度にも制限があります。

「Spatial Coding」は、近傍のオブジェクトやベッドを単一の「エレメント」にクラスタリングする処理のことを言い、Dolby Digital Plusでは、エンコード段階で最大16個のエレメント(15オブジェクト + LFE)まで削減されます。このクラスタリング処理は、チャンネル・ベースで言うところの「ダウンミックス」に近い処理と考えられますが、時間経過とともに、もとのオブジェクトがエレメント間を行き来したり、エレメント自体の座標が移動する点が異なります。

Spatial Codingの概念図 [参考文献4より]
(左図の19個のオブジェクトが、この処理によって右図の11個の赤丸にまとめられる)

Joint Object Coding (JOC)

Spatial Codingによって16個にまとめられたオブジェクトは、更に「Object Audio Renderer (OAR)」によって、5.1chにダウンミックスされます。この信号はそのまま、Dolby Digital Plusエンコーダーで圧縮され、5.1chのDolby Digital Plus信号として出力されます。

Dolby Digital Plusエンコーダーのブロック図 [参考文献5より]

一方、「JOC Encoder」はOARが出力するダウンミックス信号と、もとの16エレメントを比較し、その差分をデータ化します(JOC Parametric Data) 。この差分データと、もとのオブジェクトのメタデータ(Object Audio Metadata)は「Extended Metadata (EMDF)」として、5.1chでエンコードされたDolby Digital Plusフレームの予約領域に格納され、合わせて384〜1024kbpsのビットレートで配信されます(384kbps配信時は12オブジェクトまでの対応)。

Dolby Digital Plusフレーム

もともと使われていなかった領域にDolby Atmosとしての拡張信号を収録しているため、Dolby Atmos非対応機ではこの信号が無視され、ダウンミックスされたDolby Digital Plus 5.1ch信号として再生されます。この場合、Dolby Atmos特有の空間情報は失われるものの、ダウンミックス前の16オブジェクトはもちろん、Spatial Codingされる前の全オブジェクトの音が含まれているのがポイントです。

スピーカー・レイアウト

AVアンプに搭載されたDolby Atmosデコーダーは、部屋のスピーカー・レイアウトに応じて、各オブジェクトをリアルタイムにレンダリングします。以下に家庭用Dolby Atmosの代表的なスピーカー・レイアウトを図示します。

Dolby Atmosの代表的なスピーカー・レイアウト [参考文献6より]

尚、家庭用Dolby Atmosの規格上の上限は、34個のスピーカーを使った構成(水平レイヤー24ch + ハイト10ch)ですが、2023年現在、フラグシップのAVアンプでも9.4.6chまでの対応となっています。

マルチスピーカー以外での再生

自宅にマルチスピーカーのホームシアターを設置している人は限られています。では、それ以外の人が、Dolby Atmosの立体音響技術を体験できないかというと、そうでもありません。

Dolby Atmos対応デバイス(PCやスマホ)は、多くの場合、ステレオ・スピーカーでのバーチャル・サラウンド再生やヘッドホン再生(バイノーラル)にも対応しているため、本格的なホームシアターを組んでいなくても立体音響を楽しむことができます。

iPhone内蔵スピーカーでの空間オーディオ再生イメージ (2019年9月のApple Eventより)

各デバイスにおける再生方法については、本記事の【後編】で詳しく紹介します。

そのほかのDolby Atmos対応コーデック

Dolby Digital Plus以外に、Dolby Atmosによる立体音響に対応したコーデックは3つ存在します。Live ExtremeはDolby Digital Plus配信以外には対応していませんが、参考までにご紹介します。

Dobly TrueHD

「Dolby TrueHD」は、DVD-Audioに採用されたロスレス音声圧縮方式である「MLP (Meridian Lossless Packing)」を機能拡張したもので、Blu-ray Discには最大 7.1ch (サンプルレート96kHz時)、または 5.1ch (サンプルレート192kHz時) のDolby TrueHDを収録することができます。

Dolby TrueHDもDolby Digital Plusと同様に、従来からのDolby Atmos非対応機器との互換性を保ちながら、Dolby Atmosにも対応できるような拡張がされています。

この信号は、ロスレス圧縮技術が利用されており、Dolby Digital Plusよりも高音質と言えますが、家庭向けにSpatial Codingによるオブジェクト数の削減は不可避なので、Dolby Atmosマスターと同一の音質でない点は注意が必要です。

Dolby TrueHDによるDolby Atmosは、ストリーミング・サービスでは利用されていませんが、Blu-ray Discでは広く利用されています。尚、Dolby Atmos対応時のDolby TrueHDのサンプルレートの上限は192kHzではなく、96kHzとなっています。

Dolby AC-4

DVD-Videoに採用された「Dolby Digital (AC-3)」、Blu-Ray Discに採用された「Dolby Digital Plus (Enhanced AC-3)」に続き、Dolby Laboratoriesが開発した次世代のロッシー音声圧縮コーデックが「Dolby AC-4」です。

Dolby Digital Plusの2倍の圧縮効率を誇り、Joint Object Codingを強化した「Advanced Joint Object Coding」などの技術を使い、Dolby Atmosも高能率で圧縮できます。

AC-4には、空間オーディオの圧縮率を更に高める仕組みがあります。それが、モバイル専用の圧縮フォーマットである「Dolby AC-4 IMS (Immersive Stereo)」で、イマーシブ・オーディオをオブジェクトではなく、2ch信号とメタデータで記録します。この2ch信号はエンコードの時点でバイノーラル処理されており、かつAC-4で圧縮されています。このため従来方式より低ビットレート (64~320kbps) での伝送が可能となっています。

AC-4 IMSブロック図 [参考文献7より]

再生側では、バイノーラル音声(ヘッドホンで立体音響を再現)はもちろんのこと、メタデータを手掛かりに、

  • バーチャル・スピーカー(ステレオ・スピーカーで立体音響を再現)

  • ダウンミックスされた通常のステレオ

を生成することが可能で、ヘッドホンの接続状況やソフトウェア設定に従い処理が切り替わります。

Dolby AC-4 IMSは既にサービス利用されており、Amazon Music HDやTidalでは、モバイル端末再生時はAC-4 IMSで配信されています(STB等ではDolby Digital Plusで配信)。これはモバイル環境における通信速度の制限を考慮した結果かと思われます。一方、Apple Musicはヘッドホン再生時もDolby Digital Plusで配信されていますが、これはヘッドトラッキングに対応するためと考えられます。(ヘッドトラッキングに対応するには、バイノーラル化される前の空間情報が必要)

Dolby MAT

上記コーデックが記録フォーマットなのに対し、「Dolby MAT (Metadata-enhanced Audio Transmission)」は伝送のみに利用されるフォーマットです。Dolby MAT 1.0は、Blu-rayプレイヤーからAVアンプまで、可変ビットレートであるDolby TrueHD信号を固定ビットレート(18Mbps)でHDMI伝送するために利用されてきました。Dolby TrueHDの予約領域も含めビットストリームが伝送されるため、Dolby Atmosの伝送も可能です。

Dolby MAT 2.0では、更に24MbpsのLPCM + Dolby Atmos用メタデータも伝送できるようになりました。一般にデータ圧縮はロスレス/ロッシーを問わず、大きな遅延を伴います。Dolby MAT 2.0で非圧縮のオブジェクト・ベース・オーディオ伝送できるようになったことで、リアルタイムでDolby Atmosエンコード/伝送が可能となりました。これは空間オーディオ対応ゲームで大きな威力を発揮し、Xbox Series XやApple TV 4Kが対応しています。

まとめ

ここまでDolby Atmos技術について広く見てきましたが、同じDolby Atmosという名称でも、利用目的に応じて多くの異なる技術や仕様が存在していることがお分かりいただけたかと思います。一見複雑に見えますが、制作フォーマットは共通しており、効率的にマルチプラットフォームに展開できることが、Dolby Atmosの最大の魅力といえます。

次回はLive Extremeでの配信方法や、各再生プラットフォームにおける対応状況についてご紹介します。

参考文献・クレジット

[1]「Dolby Atmos」(公式サイト)
[2] ドルビージャパン(株)「ドルビーの魔法: カセットテープからDOLBY ATMOSまでの歩みをたどる」
[3]「Dolby Professional - Cinema Solutions」(公式サイト)
[4] Heiko Purnhagen, Toni Hirvonen, Lars Villemoes, Jonas Samuelsson, Janusz Klejsa「Immersive Audio Delivery Using Joint Object Coding」(AES Convention Paper, 2016年6月4-7日)
[5] Nick Engel「Dolby Atmos Immersive Audio From the Cinema to the Home」(AES Melbourne Section Meeting, 2017年12月11日)
[6]「Dolby Atmos Speaker Setup Guides」(公式サイト)
[7]「Dolby® AC-4: Audio delivery for next-generation entertainment services」(whitepaper, 2021年2月)

Dolby、ドルビー、Dolby Atmos、Dolby Digital PlusおよびダブルD記号は、アメリカ合衆国とまたはその他の国におけるドルビーラボラトリーズの商標または登録商標です。その他の商標はそれぞれの合法的権利保有者の所有物です。

この記事が気に入ったらサポートをしてみませんか?