AIもろもろ

本

運営しているクリエイター: はまち

#ディープラーニング

オーディオ超解像技術 AudioSR を試す

低解像度の音声データを超解像化をする拡散ベースの生成モデル AudioSR が公表されていました。リンク先に変換サンプルなどもあり、音声や自然音、音楽など幅広いジャンルの例が示されています。高い再現度であるようなので、さっそく試してみました。早速ためしてみます。以下サンプルコードを試してみます。インストール !pip install git+https://github.com/haoheliu/versatile_audio_super_resolution 実

Stable Diffusionモデルを応用した超解像技術 DiffBIRを試す

テキストから画像への生成モデルであるStable Diffusionの事前学習モデルを活用して、劣化画像のブラインド画像復元タスク（超解像タスク）を行うDiffBIRというフレームワークが提案されています。サンプルコートも公開されているので早速試してみました。 DiffBIRはBSR（Blind Image Super-Resolution ブラインド画像復元）、およびBFR（Blind Face Restoration 顔画像の復元）の先行研究と比較して優れた結果を示して

AIもろもろ

フォローしませんか？

#ディープラーニング

オーディオ超解像技術 AudioSR を試す

Stable Diffusionモデルを応用した超解像技術 DiffBIRを試す