オーディオ超解像技術 AudioSR を試す
低解像度の音声データを超解像化をする拡散ベースの生成モデル AudioSR が公表されていました。リンク先に変換サンプルなどもあり、音声や自然音、音楽など幅広いジャンルの例が示されています。高い再現度であるようなので、さっそく試してみました。
早速ためしてみます。
以下サンプルコードを試してみます。
インストール
!pip install git+https://github.com/haoheliu/versatile_audio_super_resolution
実行!
GPUメモリを16GBくらい消費します。Google Colab無料枠だとメモリが足らなくて動かない感じでした。
!audiosr -i /content/kurumi.wav
変換例
変換前(サンプリングレート8kHz)
変換後
今回の例では若干キンキンする感じになった気もしますが、くもった感じの音から、広がりがある感じの音になった印象です。いかがでしょうか。
この記事が気に入ったらサポートをしてみませんか?