サンプルレートとビット深度についてのシンプルな説明
この記事は細かいことがよく分かっていない人がどんな環境設定にすれば人間が聴いた時に問題無いかに主眼を置いて、人間の聴覚とデジタル信号処理の観点からかなり説明を端折りつつ科学的に説明します。
はじめに: ビット深度に関するよくある誤解
ビット深度が大きければ音が良いという誤解がありますが、正確には「ビット深度が高ければノイズが少ない」です。ビット深度でノイズの量は増減しますが、あくまでそれらはノイズなので元の信号に影響を及ぼしません。
DAWの設定
DAWで曲を作り始める時は
録音時のビット深度: 24bit
サンプルレート: 48kHz(例外あり)
内部処理: 64bit float(無ければ32bit float)
にしておけば事故りません。
素材の書き出し
録り終わった演奏やステムを書き出す時は
24bit / 48kHz
にしておけば問題ありません。それ以上を要求されることもありますが音に影響することは無いので、一旦上記のフォーマットで書き出してから指定されたフォーマットに変換すれば良いでしょう。
マスターの書き出し
最終的なマスター(リスナーの耳に届く波形)を書き出す場合は
16bit / 48kHz (CDであれば44.1kHz)
にしておけば大丈夫です。
制作過程とマスターに求められるフォーマットの違い
最初にこの違いのコンセプトを説明すると「マスターはその後手を加えられる心配が無いので人間にとって必要な情報以外全部フィルタリングしてOKだけど、制作中は色々滅茶苦茶な処理をするのでかなり広めの安全マージンをとって作業した方が都合が良い」ということです。グラフィックデザインに例えると、1400px四方でデリバリーするデザインを制作する時に作業自体は2800px四方くらいでやるようなイメージです。
まずビット深度について、制作は24bit(ノイズフロアが約-144dB)にしておいた方が安全です。これはミキシングのステージで元素材のレベルが数十dB持ち上がったり、数百もの他のトラックと合算されたりするからです。素材が16bit(約-96dBのノイズフロア)では十分に低く無い可能性があります。
一方でマスターは16bitで十分です。これはその後これ以上ノイズフロアが高くなる心配が無いからです。例えばこのノイズフロアが聴こえるような音量で音楽を聴くと音楽本体は聴覚に障害を及ぼす音量になり、最悪死に至ります。裏を返せば、自分が苦痛を感じない音量で音楽を聴いている限り、-96dBのノイズフロアを知覚することはほぼ不可能です。(データ上は目に見えるので不安かもしれませんが)
続いてサンプリングレートについてですが、制作時になるべく高いレートにしておいた方が望ましいのは確かです。これは折り返しノイズを防ぐローパスフィルターを入れる時の安全マージンが広がるからです。最終的には20kHzあたりまでの情報が安全に収められれば人間が聴く分にはOKなわけですが、サンプリングレートが低ければ低いほどこのフィルターを急にしなければならないためリスクが高いのです。
というわけでマスターは44.1kHzで十分なのです。繰り返しになりますが、この周波数の中に人間の聴覚にとって必要な情報を全部詰め込みつつ不要な情報をフィルタリングすることが技術的に可能だからです。
おまけ: サウンドデザイナー向け設定
録音後に極度にピッチを下げる場合は高いサンプルレートで録るメリットが非常に大きいです。96kHzや192kHz、必要に応じて384kHzやそれ以上で録音しておけば数オクターブピッチを下げても可聴域のハイが失われることはありません。
おまけ: プラグインの内部処理について
エキサイターのように積極的に歪みを足すプラグインでオーバーサンプリングが可能なものはCPU負荷と相談しながらオーバーサンプリングした方が安全です。詳しく知りたい人は「折り返し雑音」「ナイキスト周波数」で検索して下さい。
おまけ: ビット深度とビットレートの違い
ビットレート = 1秒あたりのデータ量
ビット深度 = 1サンプルあたりのデータ量
サンプルレート = 1秒あたりのサンプル数
です。なので、ビットレートはビット深度とサンプルレートを掛けたものです。
ビットレート(bit/s) = ビット深度 (bit/sample) x サンプルレート (sample/s)
理系の方はこう書くとわかりやすいと思います。
おまけのおまけ: 英語がわかる方向けに
この記事の数値を鵜呑みにするのではなく背景知識までしっかり学習したい場合、この辺りが分かりやすいです。
この記事が気に入ったらサポートをしてみませんか?