見出し画像

オーディオ超解像技術 AudioSR を試す

低解像度の音声データを超解像化をする拡散ベースの生成モデル AudioSR が公表されていました。リンク先に変換サンプルなどもあり、音声や自然音、音楽など幅広いジャンルの例が示されています。高い再現度であるようなので、さっそく試してみました。

早速ためしてみます。

以下サンプルコードを試してみます。

インストール

!pip install git+https://github.com/haoheliu/versatile_audio_super_resolution

実行!

GPUメモリを16GBくらい消費します。Google Colab無料枠だとメモリが足らなくて動かない感じでした。

!audiosr -i /content/kurumi.wav

変換例

変換前(サンプリングレート8kHz)

変換後

今回の例では若干キンキンする感じになった気もしますが、くもった感じの音から、広がりがある感じの音になった印象です。いかがでしょうか。

この記事が気に入ったらサポートをしてみませんか?