音を作るということ(マスタリングのお話)

 音を作るという工程は様々あるけど、今回は「プロセッサー」を中心に考えてみる。多くの人がプロセッサーの事を「音を良くする機器」と勘違いしている。まあ実際いい音にするためにプロセッサーを使うこともあるのはあるけど、プロの世界だと割とそれは最終的な作業であって、それよりも「ダイナミックレンジの確保」という最も大きな命題のために多くの時間を割かれることになるはずである。

そもそもプロセッサーとは

 プロセッサー・・・日本語に訳すと「処理装置」とかそんな意味になる。つまりなにか「処理」するのがプロセッサーで、音響の世界では「エフェクター」「コンプレッサー」「リミッター」「イコライザー」等など、音声を処理するための装置の総称として「プロセッサー」と呼ばれる。これらの機器を単体で扱うこともあるし、またこれらの機能が一元化された「マスタリングプロセッサー」などと呼ばれる機器も存在する。どれを使うかはまったくユーザーのお好み次第で正解は無い。ただ一つ言えるのは、プロセッサーはその性質上「原音を破壊する」ので、そもそも「音を聞きやすくする」「好みの音に変化させる」事はできても「音を良くする」事はできない。もっとも「良い音とはなにか」という定義が必要だけど、処理を重ねるたびに原音の信号は変化させられていることを考えると、原音より「良い音」になることはありえない。

「良い音」の定義

 ここで頻繁に使われる「良い音」を定義したい。そもそもこれはプロの現場で仕事をしている人を含めて、全人類普遍的に「良い音」というものは存在しない。「良い」という感覚は究極的な個人の感覚であり、また音声については個人間での聴力差により、聞こえている音がそもそも違うという可能性が否定できない。実際に筆者は加齢も相まっていわゆる「モスキート音」が聞こえにくい(たぶん12KHz以上は聞こえてない気がする)。それと、筆者的にはトランペットスピーカーから流れてくる炭坑節は「めちゃくちゃいい音」に聞こえるけど、同様の環境GenesisとかJourneyを聞いてもあまりいい気分はしない・・否、「アリ」かな・・・。
 まあそんな感じで「良い音」という定規は存在しないので、じゃあどうするかというと「原音をなるべく損なわず、万人が聞きやすいと思われる音質に変化させる」ことがマスタリングの目標であって、マスタリングに携わる技術者の腕の見せ所でもあったりする。

ダイナミックレンジの確保

 もう一つマスタリングには重要(むしろこっちが本命)な作業があって、それがダイナミックレンジの確保である。ダイナミックレンジとは記録されている音量の最大値と最小値(通常は無音)の差の広さを表していて、一般的にはdBで表現される。そして、様々なメディアには適正なダイナミックレンジが決まっていて、たとえばCDは96dB、FM放送は60dB、デジタル放送(テレビ等)は100dB程度と言われている。なお、デジタルメディアでのダイナミックレンジは、サンプリング周波数によって定義される。
 ところで人間の耳で聞き取れるダイナミックレンジは140dB程度といわれている。またコンサートホールで聴くオーケストラのダイナミックレンジは130dB程度。つまり、録音(記録)された音声は、人間の耳や生音には到底及ばない「狭い」レンジしか持っていないということになる。わかりやすく言うと、オーケストラの演奏をCDに録音したいと思った場合、130dBあるダイナミックレンジをなんとか96dBに抑えなければならない=わかりやすく言うと音量を下げなければならないことになる。しかしここでまた問題が発生する。人間の耳は、周波数によって聞こえ方が変わってきており、全体の音量を下げると、端的には周波数の高い成分が聞き取りにくくなる。このため、単純に音量を下げるだけでは「良い音」の確保ができない。つまり、周波数帯ごとの音量調整が必要となる。

等ラウドネス曲線

 『人の聴覚は物理的な音圧が同じでも周波数により感覚としての音の大きさ(ラウドネス)が異なる。等ラウドネス曲線(とうラウドネスきょくせん)は等しい音の大きさと感じる周波数と音圧のマップを等高線として結んだものである。』(wikipedia「等ラウドネス曲線」)

画像1

 一般的な人間の聴覚は等ラウドネス曲線で表されるような特性をしており、いわゆる「ドンシャリ」な傾向にある。このため、単純に全体の音量を下げると、低音と一部の高音のみ目立つ音となってしまい、原音からかなりかけ離れた音になる(ちなみにドラマCDなどの演出で遠くの人の声を再現するときも、この表を参考にしつつ音量下げを行うと、割といい感じになる)。これを補正するためにはグラフィックイコライザー(GEQ)やマルチバンドコンプを利用することが多くなる。多くの場面ではマルチバンドコンプが利用されるようである。

マルチバンドコンプ

 一般的なコンプレッサーと違い、マルチバンドコンプは音声の周波数帯によって圧縮パラメーターを変えることができる。通常は「低域」「広域」の2バンドとなるが、放送用だと5バンドなど「より細分化」されたものがある。マルチバンドコンプを使うと、たとえば音量を抑えなければならない場面において、低域をより強く、広域はやや残しながら圧縮を行うので、電気信号としての音量はかなり下がるものの、実際には聞こえる低域をより強く抑えることができるため、聴感上のニュアンスを崩さない程度に全体の音量を圧縮することができる。こうした作業によって、はじめて「希望するメディアの特性に最大限マッチしたダイナミックレンジを持つ音声」を作り出すことができる。FM放送局等で送信機に送られる音を加工するoptimod等がその好例である(あだしoptimodを使えばいい音になるというわけではないところに注意。あくまで(FM放送の場合)電波に乗せるのに最適な音に加工しているという前提がある)

「良い音」を作るのがプロセッサーの仕事、ではない

 つまりコンプレッサーのしごとは積極的な音作りではなく、むしろ「入れ物に詰め込むために仕方なくある程度の音を犠牲にする」作業であると言える。しかし、その犠牲を最小限にし、かつ聴感上は原音のニュアンスを最大限残すという、割と相反する作業を行って、その妥協点を見つける「消極的」な音作りとも言える。
 とどのつまり、「単純にスピーカーから出てくる音を自分好みにする」だけであれば、なにも考えずに好き放題音をいじくり回せばいいし、ユーザーの立場であるなら、それは一つの楽しみ方ではある。他方、プロとしてユーザーやリスナーに「自分の意図する音」を届けたいのであれば、その人が「どんなメディアで聴くのか。」までを熟考した上での音作りが必要となってくる。それを意識した作業ができるかどうか、がプロとアマの違いの一つであると思う。

※本文はここまでです。この記事を気に入っていただけたらご支援をお願いします。

ここから先は

40字

¥ 100

期間限定 PayPay支払いすると抽選でお得に!

この記事が気に入ったらサポートをしてみませんか?