サンプリングレート・ビット深度・ビットレートについて。
※本記事は全文無料で読むことができます。※
こんにちは、Torqueです。
今回はサンプリングレート(サンプリング周波数)・ビット深度・ビットレートについて解説していきます。
本記事は少し専門的な内容です。ご了承ください。
(そもそもサンプリングレートとかビット深度を詳しく知ろうと思っている人が初心者なわけないという前提で書く。)
¥200の投げ銭ができるようにしてみました。
無料で最後まで読むことができますが、もしよければ缶コーヒーを奢るくらいの気持ちで投げ銭していただけると嬉しいです。
1. 初めに
DTMをやっているとDAWの設定やオーディオの書き出しでよく
「ビット深度:16bit / サンプリングレート:44.1kHz」
「ビット深度:24bit / サンプリングレート:48kHz」
などの表記を見ます。
「数値が大きいほど高品質になるが、データ量が増えPCへの負荷も大きくなる」ことは知っているかもしれません。なぜ数値が大きいと品質が良くなり、同時に負荷も大きくなるのか。信号処理の観点から端的に解説していきます。
本記事の筆者であるTorqueですが、高専の電気工学科卒、前職は一部上場の電機製造系企業で新商品開発事業部の開発部に所属していました。現在は仕事の傍らボカロP活動などいろいろと音楽制作をしています。
工業系技術者の道を歩んできた者として、これまで学んだ知識を活かして音楽制作に携わる全てのクリエイターになるべく分かりやすく解説できればと思います。
用語だけではなく原理的なことについても理解が深まれば幸いです。
2. 標本化(サンプリング)とサンプリング周波数(サンプリングレート)
「音」とは正確には空気中を伝搬する振動エネルギーです。この振動が人間の鼓膜に入って初めて音として知覚されます。
自然界に存在する音は全て滑らかな波形です。これを連続的な信号と言います。
対して、デジタルな電気の世界では全て0か1の区切られた信号でしか存在できません。これを離散的な信号と言います。
ある連続的な信号を時間的に離散的な信号へ置き換えることを標本化(サンプリング)と言います。
標本化する際の、単位時間あたりの標本化回数をサンプリング周波数(サンプリングレート)と言います。
単位は一般的に「Hz」(ヘルツ)が使用されています。
分かりやすくいうと、サンプリングレートとは「1秒間を何分割するかを示す値」と言えるでしょうか。
44.1kHzは1秒間あたり44,100分割していることを指します。
96kHzは1秒間あたり96,000分割していることを指します。
数値が大きいほど1秒間あたりの分割数が増えてより原音に近くなる(=高音質になる)のですが、処理回数が増える分データ量も大きくなります。
4. 量子化とビット深度
標本化は時間的な視点からアナログ信号をデジタル信号へ変換します。しかし、これだけでは音が鳴っているか、鳴っていないかしか判断出来ません。
標本化された各信号を音量レベル的に離散的な信号へ置き換えることを量子化と言います。
量子化することによって、ある時点で鳴っている音がどれくらいの音量で鳴っているのかを表すことが出来るようになります。
標本化された各信号の分割数を2の○乗と表した時、○の値をビット深度と言います。
分かりやすくいうと、ビット深度とは標本化された各信号の「音量レベル的な分割数」を指します。
16ビットは音量レベルを2の16乗 = 65536 段階に分割していることを指します。
24ビットは音量レベルを2の24乗 = 16777216 段階に分割していることを指します。
標本化と同様に数値が大きいほど分割数が増えてより原音に近くなり、その分処理回数が増えてデータ量も大きくなります。
5. ビットレート
ビットレートとは「1秒間あたりのデータ量」です。
単位は一般的に「bps」(ビーピーエス)を使用します。
これまでに解説した「サンプリングレート」と「ビット深度」を掛け合わせたものがビットレートです。
計算式で表すと
となります。
ステレオ音源の場合、左右で鳴る音が分かれるため
になります。
音楽CDの一般的な規格である「16bit / 44.1kHz」を例としてビットレートを計算すると
となります。14111200(bps)は約1400(kbps)です。
比較的高音質とされている192(kbps)(Youtubeの音声ビットレートの上限)でも、一般的な音楽CDよりも大幅に音質が劣ることを表しています。
6. まとめ
サンプリングレート:音を1秒間に何分割するか示す値
ビット深度:標本化された各信号を「音量レベル的に」何分割するか示す値
ビットレート:「サンプリングレート」と「ビット深度」を掛け合わせた値
7. おまけ。サンプリング定理と44.1kHz
あるsin波があるとします。
sin波の正確な周期を知るためには1周期に2点以上標本化しなければいけません。
あるオーディオデータに存在する最大周波数をfmaxとしたとき、 2 fmaxを超えるサンプリングレートで標本化すれば、すべての信号を処理できることになります。これをサンプリング定理と言います。
2 fmaxを超えるサンプリングレートをfsとすると、サンプリング定理は下記の計算式で表せます。
(fmaxをナイキスト周波数と言います。)
人間の可聴域は20~20kHz程度と言われています。
そのため20kHz以上の音はあっても無くても人間の耳には認識できないと考えられます。
20kHzの2倍以上の値である44.1kHzのサンプリングレートであれば理論上はデジタル信号に変換しても原音と同じ音が聴こえることになります。
データ量をなるべく節約しつつ最適な音質を保つため、CDの規格ではサンプリングレートが44.1kHzと定められています。
実際には、人は20kHz以上の音も何らかの形で知覚していると言われています。また、少なからず原音から失われる音があることから、より高いビットレートで変換することで可聴域内の音質にも影響があるという意見もあります。
8. 参考文献
第1章 信号処理の基礎 | FFTアナライザ入門 - A&D
サンプリングレート・ビット深度・ビットレートの意味と関係性
ナイキスト周波数 - Wikipedia
ここから先は
¥ 200
読んでくれてありがとうございます!