見出し画像

Stable Diffusionのimg2imgで好みの絵を作成するまでの過程

先日、Stable Diffusionが公開されました。
Stable Diffusionにはテキストから画像を生成するtxt2imgと画像から画像を生成するimg2imgという機能が実装されています。今回はimg2imgを使用してある程度好みの絵柄になるまで試行錯誤を行った過程を記録したいと思います。

黒髪のジトっとした目の女の子が生成したかったので、まずはそれっぽい絵を用意しました。

入力画像A

promptを
"a portrait of a cute girl,Girl with dark hair and wearing a school uniform, detailed face with gorgeous eyes, by mucha, by Range Murata, by Akihiko Yoshida, C95, C96, trending on pixiv, trending on Artstation"
と設定してオプションを
--strength 0.5 --n_iter 2 --n_samples 5 --H 576 --W 768
で生成します


出力画像A1
出力画像A2
出力画像A3

他にも8つほど画像がありますが割愛します。
次に最も破綻していない出力画像A1の不自然な部分を修正をしました。

入力画像B

背後のスカスカ部分や、大きすぎる目、髪に絡まった赤いリボンをスポイトでガシガシ消します。

オプションを
--strength 0.35 --n_iter 2 --n_samples 5 --H 576 --W 768
に設定して再度入力

出力画像B1
出力画像B2
出力画像B3

出力画像B2が好みだったので修正
服の襟を追加したりシワをスポイトでガシガシ消しました。

入力画像C

オプションを
--strength 0.2 --n_iter 2 --n_samples 5 --H 576 --W 768
に設定して再度入力

最終結果


画像の選定は1分、修正は3分程度で済みました。
promptやStrengthを微調整すれば猫耳を生やしたり眼鏡を追加することもできそうです。

この記事が気に入ったらサポートをしてみませんか?