見出し画像

Stable Diffusion日記(Upsampling)

前回の投稿でUpsampleのDenoising Strengthを変更することで
低いほど元を重視し、高いほどオリジナリティを出す傾向があると分かったが、Upsamplingメソッドにもいろいろある。

今回使った元画像

画像を変えてみた。人魚の潜水艦ガイドさん。立ち絵にするのに苦労した。。。
  • Positive Prompt

    • 1 girl, (mermaid:1.2), silver hair, long hair, blue eyes, scale dress, bus guide, (submarine:1.1), fish eye, (underwater city:1.1), highly civilized, pixiv style, 4k, super high resolution

    • 海底都市に来た潜水艦のガイドさんをイメージして

    • 立つのは割とレアケース

  • Negative Prompt

    • nsfw, (worst quality, low quality:1.4), (lip, nose, tooth, rouge, lipstick, eyeshadow:1.4), (blush:1.2), (jpeg artifacts:1.4), (depth of field, bokeh, blurry, film grain, chromatic aberration, lens flare:1.0), (1boy, abs, muscular, rib:1.0), greyscale, monochrome, dusty sunbeams, trembling, motion lines, motion blur, emphasis lines, text, title, logo, signature, (fish:1.2)

    • 自然や動植物が多そうな環境の背景だと謎生物がうかんでくるのでfishだけは消しといておく

  • Stable Diffusion: AOM_sfw

  • VAE: kl-f8-anime2

  • Sampling Method: Euler a

  • Sampling Steps: 80

  • size: 720 x 512 -> 1440 x 1024

比較

Denoising Strengthは0.75を指定。結構元の画像と変化がある。

  • Latent

    • vanilla

    • antialiased

    • bicubic

    • bicubic antialiased

    • nearest

    • nearest-exact

  • None

  • Lanczos

  • Neaest

  • ESRGAN_4x

  • LDSR

  • R-ESRGAN 4x+

  • R-ESRGAM 4x+ Anime6B

  • ScuNET

  • ScuNET PSNR

  • SwinIR_4x

結果

横に並べ過ぎた。。。

全体的な傾向(中央部に大きな柱ができている、中央の巨大な潜水艦がなくなっている)などはどのUpscalerでもあまり変わらないから割とマジで気分。良くなかったものを紹介して反面教師にしていただければ

良くないと思ったやつ

None
単にピクセル数を上げただけで近づいてみるとぼやけや細部の不明瞭さが目出つ

右建物の窓が完全に細胞

正直Noneについてもいちゃもんみたいなものだし他についてはそれぞれの味があるからこれもガチャな感じ。Denoising Strengthの方が絵の内容を決めるためには重要な気がする。

終わりに

うまくいっているプロンプトはいくらガチャってもいいくらいできる画像のクオリティが自分に刺さっている感じ。AI絵でLive 2Dのように動きを付けられるようにしたいです。新しいプロンプトをもっと作れください。

  • 姿 → 画像生成AI

  • 声 → Retrieval based Voice Conversionなどを使ったリアルタイム変換

  • 内容 → ChatGPTなどの文章生成AI

で万物のバーチャルライバーができるようになったなと感じるようになってます。

マイ・ベスト・イラスト・オブ・マーメイド

参考

この記事が気に入ったらサポートをしてみませんか?