見出し画像

65. Wav ファイルを深堀る

前回の記事                        次回の記事

はじめに

前回、前々回で、Windows のマルチメディア系の機能を使ってマイクロフォンデバイスから音を収集し、wav という拡張子がついたファイルで保存しました。
今回は音データとそれを保存する Wave ファイル(wav)を IoT 的な観点から深堀る事にします。

音データ

音は空気の振動です。マイクロフォンデバイスは、その振動を電気信号に変換するデバイスです。それをコンピューターの仕組みを使って、定期的に計測(サンプリング)した一次元の時系列データが、音データです。
この文章から、概念モデリング的な観点から、音データ計測に関する特徴値を抽出すると、

  • サンプリングレート

    • 何秒間隔で電気信号を読み取るか

    • 前の記事でも書きましたが、ある周波数の振動を計測したい場合は、その周波数の二倍のサンプリングレートが必要です

  • 音データ表現の為のビット数

    • 振動からの電気信号変換、そして、コンピューターによる読取は、基本的に、アナログ→デジタル変換を行います。この際、何ビットのデジタルデータで表現するか決める必要があります

    • このビット数が増えれば増えるほど、音データの解像度が増します

  • 各計測点の計測されたデジタル値

辺りがすぐに思い浮かびます。少なくとも、音データを扱う場合には、これらの特徴値は最低限保持しておく必要があるでしょう。

計測点(チャネル)ごとのデータ

加えて、マイクロフォンデバイスには、指向性というものがあり、各デバイスの特性に応じて、振動を計測できる範囲が決まっています。音を収集するデバイスには、複数のマイクロフォンデバイスが装備されているものが多くあります。例えば、前回の記事で使った LIVE! Cam 1080 は、二つのマイクロフォンデバイスが装備されていて二系統の音の一次元時系列データを計測可能です。いわゆるステレオですね。
他にも、Seeed Studio が販売している ReSpeaker Mic Array は、7個の Digital マイクロフォンデバイスが装備されています。このデバイスは、7個それぞれから収集した音データの大小を比較することにより、音がどの方向からしているのかを判別することができるので、IoT シナリオ向きのデバイスといえるのではないでしょうか。

ここから先は

8,813字 / 10画像

2022年3月にマイクロソフトの中の人から外の人になった Embedded D. George が、現時点で持っている知識に加えて、頻繁に…

この記事が気に入ったらサポートをしてみませんか?