![見出し画像](https://assets.st-note.com/production/uploads/images/116249092/rectangle_large_type_2_4f194e8e3f5adc631e23978c174c3864.png?width=800)
オーディオ超解像技術 AudioSR を試す
低解像度の音声データを超解像化をする拡散ベースの生成モデル AudioSR が公表されていました。リンク先に変換サンプルなどもあり、音声や自然音、音楽など幅広いジャンルの例が示されています。高い再現度であるようなので、さっそく試してみました。
![](https://assets.st-note.com/img/1694762466557-xkdovZjtIY.png?width=800)
早速ためしてみます。
以下サンプルコードを試してみます。
インストール
!pip install git+https://github.com/haoheliu/versatile_audio_super_resolution
実行!
GPUメモリを16GBくらい消費します。Google Colab無料枠だとメモリが足らなくて動かない感じでした。
!audiosr -i /content/kurumi.wav
変換例
変換前(サンプリングレート8kHz)
変換後
今回の例では若干キンキンする感じになった気もしますが、くもった感じの音から、広がりがある感じの音になった印象です。いかがでしょうか。
この記事が気に入ったらサポートをしてみませんか?