Pythonで音声編集

Eno

2021年3月12日 20:07

今回はPythonで音声ファイル処理ができるライブラリー「pydub」についての備忘録です。

まずpydubを利用するには「ffmpeg」というソフトウェアが必要になります。インストール方法は下記の記事がとても参考になりました。↓

pydubについて下記が参考にした記事になります。

pydubでできること①　拡張子変換

mp3, wav, m4a, flac, oggなど色々な拡張子に対応しています。（僕が確認したのはこの5つです。）

1行目で元の音声ファイルを読み込み2行目の sound.export (~) で変換したい拡張子を指定して保存するだけです。実行時間は、20分ぐらいのファイルでも数秒で終わりました。

pydubでできること②　無音部分で分割

sound                # 読み込んだファイルの変数
min_silence_len= ~   # ~ms以上無音なら分割、1000ms=1秒
silence_thresh= ~    # ~dBFS以下で無音と判断し分割、ここをうまく調整することで
                       話していない雑音部分をカットできると思います。
keep_silence= ~      # 分割後、~msは無音区間を残す、これにより分割したファイルの最後に
                       少し無音部分が残ります。

無音部分で分割するだけでなく、秒数を指定して分割もできます。（最初の5～10秒を抽出するなど）

（参考記事　dBFSについて）

pydubでできること③　ファイルの結合

ファイルを読み込み、変数を足し算することで簡単に結合できます。

上図はできること②で無音部分で分割したファイルをもう一度結合しています。無音部分がいい感じに削れたファイルになりました。

僕が実際にやってみたのはこのぐらいですが、他にも逆再生やフェードイン・アウトなどもできるみたいです。

音声配信をやっているみなさん、ぜひ試してみてはいかがでしょうか？僕もポッドキャストを配信しているので、編集で使えそうかもと思いました(笑)。

今回はここまで！最後まで読んでいただきありがとうございました。

次回更新をお楽しみに！

この記事が参加している募集

#最近の学び

184,605件

この記事が気に入ったらサポートをしてみませんか？

Pythonで音声編集

pydubでできること① 拡張子変換

pydubでできること② 無音部分で分割

pydubでできること③ ファイルの結合

この記事が参加している募集

pydubでできること①　拡張子変換

pydubでできること②　無音部分で分割

pydubでできること③　ファイルの結合