Pythonで音声編集
今回はPythonで音声ファイル処理ができるライブラリー「pydub」についての備忘録です。
まずpydubを利用するには「ffmpeg」というソフトウェアが必要になります。インストール方法は下記の記事がとても参考になりました。↓
pydubについて下記が参考にした記事になります。
pydubでできること① 拡張子変換
mp3, wav, m4a, flac, oggなど色々な拡張子に対応しています。(僕が確認したのはこの5つです。)
1行目で元の音声ファイルを読み込み2行目の sound.export (~) で変換したい拡張子を指定して保存するだけです。実行時間は、20分ぐらいのファイルでも数秒で終わりました。
pydubでできること② 無音部分で分割
sound # 読み込んだファイルの変数
min_silence_len= ~ # ~ms以上無音なら分割、1000ms=1秒
silence_thresh= ~ # ~dBFS以下で無音と判断し分割、ここをうまく調整することで
話していない雑音部分をカットできると思います。
keep_silence= ~ # 分割後、~msは無音区間を残す、これにより分割したファイルの最後に
少し無音部分が残ります。
無音部分で分割するだけでなく、秒数を指定して分割もできます。(最初の5~10秒を抽出するなど)
(参考記事 dBFSについて)
pydubでできること③ ファイルの結合
ファイルを読み込み、変数を足し算することで簡単に結合できます。
上図はできること②で無音部分で分割したファイルをもう一度結合しています。無音部分がいい感じに削れたファイルになりました。
僕が実際にやってみたのはこのぐらいですが、他にも逆再生やフェードイン・アウトなどもできるみたいです。
音声配信をやっているみなさん、ぜひ試してみてはいかがでしょうか?僕もポッドキャストを配信しているので、編集で使えそうかもと思いました(笑)。
今回はここまで!最後まで読んでいただきありがとうございました。
次回更新をお楽しみに!
この記事が参加している募集
この記事が気に入ったらサポートをしてみませんか?