見出し画像

【Stable diffusion】貧弱環境でも利用できるExtrasアップスケーラー画質比較/速度検証

こんにちは、どこでも金粉AI美女です!
みなさん、アップスケーラーは何を使っていらっしゃるでしょうか?

MultiDiffusionやHires.fixを利用している方がほとんどな気もしますが、私のように貧弱なローカル環境(Mac book air 16GB)のもと生成を行っていらっしゃる方は、生成速度の関係から必然的にExtras一択になってしまいます。

ただ、Extrasを使うにしても色々種類が多すぎてどれを採用すればいいのかわからない…という方も多いかと思います。

特に私の場合、光の反射具合が死活問題になってくるため(アップスケーラーによっては粒立ちすぎて油絵のようになったり、逆にのっぺりしすぎてCGのようになってしまう)一番最初に比較検証を行いました。

画質生成速度の検証結果をまとめたので以下ご覧ください。

前提:

・アップスケール元の画像サイズは400 x 640
・Kindle推奨サイズの1200 x 1920にするため、3倍にアップスケール


生成画像の比較:

比較しやすいようにスライドショーにしました。
(Youtubeさんに年齢制限設定されちゃいました😢)

結論

画質的な観点:
髪の毛を比較するとわかりやすいですが、以下のものが高品質といえます。
 ・ESRGAN_4x
 ・LDSR
 ・R-ESRGAN4x++
 ・SwinIR4x

こだわり的な観点:
個人的に、光の反射がきつすぎたり、のっぺりしすぎていたりするものよりも肌の質感が出るものが理想的だと思っています。
ESRGANとLDSRとで迷いましたが、LDSRは絵のような印象を受けたのでESRGANが最適だと判断しました。


速度比較 (n=3):

結論

LDSR、SwinIR4xは段違いで生成時間が長いです。それ以外については許容範囲内の誤差だと思います。


総括:

金粉の映え具合、生成速度の観点のどちらの面でも理想的なESRGANを採用することにしました。
時間をかけたからといって必ずしも良い結果が得られるわけではないということがわかったのは大きな発見でした。

だだ、今回の結果はあくまで私にとって理想的なアップスケーラーがESRGANだっただけという気もします。
多少面倒臭くはありますが、みなさんも比較検証を行い、ご自身のこだわりが反映されるアップスケーラーを探してみると良いかと思います。


この記事が役立ったと思った方はX(https://twitter.com/golden_aigirls) のフォローお願いします。

Kindle Unlimitedに入っていらっしゃるのであれば、写真集も見ていただけるととってもとっても嬉しいです!
amzn.to/3VzDr8M


この記事が気に入ったらサポートをしてみませんか?