見出し画像

StableDiffusion 生成時の数値など


Sampling steps

散々語られてきてる sampling steps、20~30を推奨されていてそれ以上はほぼ変わらないとは言われていますがせっかく上限が150まであるので試してみたくなるじゃないですか
なのでやってみましょう

今回の基本設定
Clipskip 1
Sampling method "Restart
Sampling steps 100
CFG Scale 15

10刻みで150まで出力してみた結果、数字が大きくなる毎に書き込み量が増えるのは確か
50辺りで服の感じが固定されて、後は服のシワとかの書き込みが増える感じですね
顔の感じも50から100にかけて変わっていって、そこからなぜか150にかけて50の頃の感じに戻って行ってます
結局、数値は高いほど細かく出るし時間もかかるので丁度いいとこ見つけてくださいと……他にまとめてくださっているかたがたと同じ結果に面白味も無いですが、グラボ性能は日々良くなっているのでstep100でもそんなに変わらない時間で出せるのではないでしょうか?
推奨設定が有るモデルでも試しに150まで試すのも面白そうです

Sampling method

次にSampling methodです
1.6.0で増えたものもあるので一気に出してみましょう

これはもう全部出してみて好きなの選ぶしか……
DPM adaptive と Restart 、新しく追加されたのもいい感じ 

CFG Scale

小さいほどプロンプトに忠実になるという事なので「漫画っぽいもじもじ顔で肩出しフリルスカートのエルフの少女が花とリボンの髪飾りを付け、魔法の杖から魔法のしぶきを出している戦闘シーン」が一番再現されてるのはどれでしょ~か?

おまけ 2,3,5,6

ざっと見たところ杖はあるかないか微妙だけど7はわりと忠実、4はそれなりだけどやっぱり杖が出ない、でもseedによって変わるかもなのでなんとも言えない
16以上はほぼ同じものが出てるけど表情としぶきと杖だったら16もいけてる

結局どう?って聞かれたら、やっぱり好みとしか言えない

これだと10が一番近い
7~10が無難なところでしょうか

Hires steps

ついでに Hires steps も見ていきましょう

こちらは40以上はほぼ変わらずといったところ

リアル系のモデルでもその傾向なのでモデルによって変わることも無さそうですね

Hires upscaler については R-ESRGAN 4x+ Anime6B でいいと思います
ちょっと淡い雰囲気にしたいときは ScuNETを使っています

ここから先は

0字

スタンダードプラン

¥500 / 月
初月無料
このメンバーシップの詳細

この記事が気に入ったらサポートをしてみませんか?