見出し画像

Pythonで音声編集

今回はPythonで音声ファイル処理ができるライブラリー「pydub」についての備忘録です。

まずpydubを利用するには「ffmpeg」というソフトウェアが必要になります。インストール方法は下記の記事がとても参考になりました。↓

pydubについて下記が参考にした記事になります。

pydubでできること① 拡張子変換

mp3, wav, m4a, flac, oggなど色々な拡張子に対応しています。(僕が確認したのはこの5つです。)

画像1

1行目で元の音声ファイルを読み込み2行目の sound.export (~) で変換したい拡張子を指定して保存するだけです。実行時間は、20分ぐらいのファイルでも数秒で終わりました。

pydubでできること② 無音部分で分割

画像2

sound                # 読み込んだファイルの変数
min_silence_len= ~   # ~ms以上無音なら分割、1000ms=1秒
silence_thresh= ~    # ~dBFS以下で無音と判断し分割、ここをうまく調整することで
                       話していない雑音部分をカットできると思います。
keep_silence= ~      # 分割後、~msは無音区間を残す、これにより分割したファイルの最後に
                       少し無音部分が残ります。

無音部分で分割するだけでなく、秒数を指定して分割もできます。(最初の5~10秒を抽出するなど)

(参考記事 dBFSについて)

pydubでできること③ ファイルの結合

画像3

ファイルを読み込み、変数を足し算することで簡単に結合できます。

上図はできること②で無音部分で分割したファイルをもう一度結合しています。無音部分がいい感じに削れたファイルになりました。

僕が実際にやってみたのはこのぐらいですが、他にも逆再生やフェードイン・アウトなどもできるみたいです。

音声配信をやっているみなさん、ぜひ試してみてはいかがでしょうか?僕もポッドキャストを配信しているので、編集で使えそうかもと思いました(笑)。

今回はここまで!最後まで読んでいただきありがとうございました。

次回更新をお楽しみに!

この記事が参加している募集

この記事が気に入ったらサポートをしてみませんか?