Stable Diffusion日記(Upsampling)
前回の投稿でUpsampleのDenoising Strengthを変更することで
低いほど元を重視し、高いほどオリジナリティを出す傾向があると分かったが、Upsamplingメソッドにもいろいろある。
今回使った元画像
Positive Prompt
1 girl, (mermaid:1.2), silver hair, long hair, blue eyes, scale dress, bus guide, (submarine:1.1), fish eye, (underwater city:1.1), highly civilized, pixiv style, 4k, super high resolution
海底都市に来た潜水艦のガイドさんをイメージして
立つのは割とレアケース
Negative Prompt
nsfw, (worst quality, low quality:1.4), (lip, nose, tooth, rouge, lipstick, eyeshadow:1.4), (blush:1.2), (jpeg artifacts:1.4), (depth of field, bokeh, blurry, film grain, chromatic aberration, lens flare:1.0), (1boy, abs, muscular, rib:1.0), greyscale, monochrome, dusty sunbeams, trembling, motion lines, motion blur, emphasis lines, text, title, logo, signature, (fish:1.2)
自然や動植物が多そうな環境の背景だと謎生物がうかんでくるのでfishだけは消しといておく
Stable Diffusion: AOM_sfw
VAE: kl-f8-anime2
Sampling Method: Euler a
Sampling Steps: 80
size: 720 x 512 -> 1440 x 1024
比較
Denoising Strengthは0.75を指定。結構元の画像と変化がある。
Latent
vanilla
antialiased
bicubic
bicubic antialiased
nearest
nearest-exact
None
Lanczos
Neaest
ESRGAN_4x
LDSR
R-ESRGAN 4x+
R-ESRGAM 4x+ Anime6B
ScuNET
ScuNET PSNR
SwinIR_4x
結果
全体的な傾向(中央部に大きな柱ができている、中央の巨大な潜水艦がなくなっている)などはどのUpscalerでもあまり変わらないから割とマジで気分。良くなかったものを紹介して反面教師にしていただければ
良くないと思ったやつ
None
単にピクセル数を上げただけで近づいてみるとぼやけや細部の不明瞭さが目出つ
正直Noneについてもいちゃもんみたいなものだし他についてはそれぞれの味があるからこれもガチャな感じ。Denoising Strengthの方が絵の内容を決めるためには重要な気がする。
終わりに
うまくいっているプロンプトはいくらガチャってもいいくらいできる画像のクオリティが自分に刺さっている感じ。AI絵でLive 2Dのように動きを付けられるようにしたいです。新しいプロンプトをもっと作れください。
姿 → 画像生成AI
声 → Retrieval based Voice Conversionなどを使ったリアルタイム変換
内容 → ChatGPTなどの文章生成AI
で万物のバーチャルライバーができるようになったなと感じるようになってます。
マイ・ベスト・イラスト・オブ・マーメイド
参考
https://economylife.net/hires-fix-upscaler-webui1111/#toc12
Upscalerの違い比較
https://gogowaten.hatenablog.com/entry/15479973
Lanczos法についての記事
この記事が気に入ったらサポートをしてみませんか?