見出し画像

ケモナーのためのStable Diffusion画像生成術 その2 ケモノ特化モデル編

まずはじめに、前回の記事を読んでくださった皆様。
ありがとうございます。
初めてのnoteへの投稿でどのくらい読まれるか、読みにくくないかなどの不安もありましたが、想像以上の反応をいただけました。

今回はその第二弾の記事になります。
本来はimg2img編を書くつもりだったのですが、ちょっと他の用事をしている間にケモノ特化のモデルが登場していたので先にそちらを紹介します。

この記事では主にモデルを変えたときの出力結果を紹介していきます。
前回のようなPromptの内容についての詳しい解説はしません。

e621, explicit content, kawaii, bangs, black long hair, art by [[hokusai katsushika]], gil elvgren, norman rockwell, thomas kinkade, intricate detail fluffy fur, shortstack anthro wolf female solo, cloth, Japanese kimono, furry fuzzy cleavage, bushy tail ears, cute adorable expression, extremely detailed digital painting
Negative prompt: tall, bra, deformed mutated disfigured hands, patreon, watermark, male gay penis knot balls intersex herm nipples, nude, text, fursona, simple background, sketch, comic, out of frame
Steps: 20, Sampler: Euler a, CFG scale: 11, Seed: 2952143513, Size: 512x704, Model hash: 4bb305c0, Variation seed: 1199760915, Variation seed strength: 0.03

今回からPromptを記述する際はNegative Promptも記載しようと思います。
とても長くなってしまいますが無いと全然違う絵が出てしまうのでご承知おきください。


モデル配布場所

モデルはいくつか存在し、どれも下記のDiscordサーバーで配布されています。
注意点として、このサーバーは18歳未満は参加できません
また、サーバー内でのコミュニケーションは英語のみとなります。

サーバーには"Yiffy-e18""Furry epoch 4""Zack3D Kinky v1"などのモデルがあります。
いずれもケモノ特化のモデルですが、学習データが違うため異なる結果が出力されます。
今回はこの中には無いですが"Yiffy-e15"モデルを試していきます。

(記事を書いている最中にYiffy-e18がリリースされました。e15モデルで記事向けの素材を作り終えてしまったので今回は古いモデルで進めていきます…)

サーバーに入ると"custom-models"というチャンネルがあるのでそこの"Yiffy - Epoch 18(ye18)"スレッドからモデルをダウンロードしましょう。


モデルの導入

ダウンロードしたモデルの使い方は使用するツールによって変わります。
前回紹介したWebUIでは"stable-diffusion-webui/models"の中に.ckptファイルを入れるとWebUI起動時の"Settings"タブから変更できるようになります。

ckptファイルを入れる場所
モデル変更操作

以上で設定完了です。


作例

tex2img

試しに前回試したPromptで生成してみましょう。

a character concept art of anthropomorphic furry fox wearing white dress, artstation, zootopia style, by gil elvgren and alphonse mucha
Steps: 20, Sampler: Euler a, CFG scale: 10.5, Seed: 3213091954, Size: 512x512, Model hash: 4bb305c0
比較元:trinart_stable_diffusion_v2

a character concept art of anthropomorphic furry wolf with flowing platinum hair, full body, artstation, by alphonse mucha and greg rutkowski
Steps: 20, Sampler: Euler a, CFG scale: 9, Seed: 722856628, Size: 512x512, Model hash: 4bb305c0
比較元:Waifu-Diffusion

a character concept art of magical (chibi) cat, zootopia style, anime style, by gil elvgren and alphonse mucha
Negative prompt: nipples
Steps: 20, Sampler: Euler a, CFG scale: 8.5, Seed: 1374407616, Size: 512x512, Model hash: 4bb305c0
比較元:trinart_stable_diffusion_v2

最後の画像のみ、前回の内容の他にNegative Promptで"nipples"を追加しました。
これを入れないとほぼ確実にNSFWなものを出してくるので…

比べてみると、絵のタッチがだいぶ変わっていることがわかります。
また、2個目の例はこのモデルだとうまく生成できないようでノイズっぽくなります。
すべてのPromptが使い回せるというわけではないようです。
Promptについては配布元のDiscordでも頻繁に議論されていているのでそこを参考にさせてもらうとよさそうです。
普段使わない英単語やスラングも多く、そういったものを知る機会にもなると思います。

先程のPromptを配布元のDiscordでも紹介されているPromptを元に調整してみます。


anthro fox wearing white dress, blond flowing hair, solo, by gil elvgren and alphonse mucha, intricate detail fluffy fur, furry fuzzy cleavage, cute adorable expression, extremely detailed digital painting 
Negative prompt: tall, deformed mutated disfigured hands, patreon, watermark, male penis knot balls intersex herm nipple, text, fursona, simple background, sketch, comic, out of frame 
Steps: 20, Sampler: Euler a, CFG scale: 11, Seed: 3753517078, Size: 512x512, Model hash: 4bb305c0
anthro wolf male wearing harem pants, muscle, flowing platinum hair, solo, by gil elvgren and alphonse mucha, intricate detail fluffy fur, furry fuzzy cleavage, extremely detailed digital painting 
Negative prompt: deformed mutated disfigured hands, patreon, watermark, penis knot balls intersex herm nipple, text, fursona, simple background, sketch, comic, out of frame
 Steps: 20, Sampler: Euler a, CFG scale: 11, Seed: 2339799991, Size: 512x512, Model hash: 4bb305c0
anthro magical cat, ((chibi)), clothing, smile, solo, [zootopia style], (anime style), by gil elvgren and alphonse mucha , intricate detail fluffy fur, furry fuzzy cleavage, cute adorable expression, extremely detailed digital painting 
Negative prompt: tall, deformed mutated disfigured hands, patreon, watermark, penis knot balls intersex herm nipple boobs, text, fursona, simple background, sketch, comic, out of frame 
Steps: 20, Sampler: Euler a, CFG scale: 10, Seed: 1967909366, Size: 512x512, Model hash: 4bb305c0

元のPromptからアレンジしつつ元の絵で表現したかった雰囲気に寄せてみました。
比較しやすいように作家関係はできるだけ同じ人物を使わせて頂いてます。
センシティブなものをいっぱい学習しているのでそういうのを出してほしくないときはNegative Promptでしっかり宣言しておいた方がいいです。


img2img

画像からの生成でもどのような効果が出るのか試してみましょう。

元絵:trinart-v2にて、惜しくも猫耳の女の子になってしまった生成物
anthro cat, wearing orange dress green ribbon, anime style, by gil elvgren and alphonse mucha
 Negative prompt: tall, deformed mutated disfigured hands, patreon, watermark, text, fursona, penis knot balls intersex herm nipple, simple background, sketch, comic, out of frame
Steps: 20, Sampler: Euler a, CFG scale: 8, Seed: 3197054882, Size: 512x640, Model hash: 4bb305c0, Denoising strength: 0.4

軽めのPromptでもちゃんとネコの女の子になってくれました。
こういった修正の場合Loopbackという生成結果から更にimg2imgをする手法もおすすめです。
Webuiの場合、img2imgの下のScriptから選べます。

3回Loopbackした生成結果

次に3Dモデルのスクリーンショットからの生成を試します。
モデルはVRChat向けに作ったキャラクターを使います。
まずはこちら。

被写体はNつ子うさぎです。BOOTHで販売中です!!!!

VRChat内でのスクリーンショット

ちなみに元のStable Diffusionで試したときの結果はこちら。

Stable Diffusionでのimg2img結果

ど根性ウサギになりました…薄めに見れば確かにこう見えなくもないけど…
では、Yiffy-e15ではというと、

e621, explicit content, art by gil elvgren, norman rockwell, thomas kinkade, intricate detail fluffy fur, anthro furry rabbit solo, pink hair, witch hat, pink fluffy wear, [vulpine] snout whiskers bushy ears, cute adorable expression, extremely detailed digital painting

Steps: 20, Sampler: Euler a, CFG scale: 9, Seed: 3547639147, Size: 512x512, Model hash: 4bb305c0, Denoising strength: 0.35

ちゃんとウサギっぽいキャラクターとして認識されてますね!
ざっくりとしか調整してないのでLoopbackなどを駆使すればもっと良くなりそうです。


続いてはこちら。

サイバーパンク和風オオカミのウォルグです。BOOTHで販売中です!!!!

VRChat内でのスクリーンショット
anthro light green wolf, female, gradation hair, wearing black suit, art by norman rockwell, thomas kinkade, intricate detail fluffy fur, cute adorable expression, extremely detailed digital painting

Negative prompt: tall, deformed mutated disfigured hands, patreon, watermark, text, fursona, penis knot balls intersex herm nipple, simple background, sketch, comic, out of frame

Steps: 20, Sampler: Euler a, CFG scale: 11, Seed: 3129357019, Size: 512x512, Model hash: 4bb305c0, Denoising strength: 0.17694719999999997, Denoising strength change factor: 0.96

お化粧強めのお姉さん感が強めになりました。
VRChatなどスクリーンショットを多く撮るゲームを遊んでいる人はそれをイラスト風にするのも面白いかもしれません。


おわりに

ケモノ特化のモデルが登場したということで取り急ぎ紹介させていただきました。
様々なところで特化モデルの凄さは見せられてきましたが、いざ自分の生成したい方向の特化モデルを使うとより実感しますね。
これらのモデルを使えば前回の記事のような試行錯誤は必要無くなりそうです。
獣人にするためのPrompt文が短くなった分、他の情報を詰め込むことができるようになったのでより具体的なPromptが書けるのも嬉しいですね。

特化モデルが増えてきた事によって、複数のモデルを混ぜ合わせる手法なども出てきています。
僕はTrinart-v2の優しい水彩っぽい絵柄が出やすいのが好きでYiffyにすこし混ぜて使ったりもしています。

Yiffy-e15:75%, trinart-v2:25% のモデルを使用
e621, watercolor, explicit content, kawaii, Anime Eyes, art by gil elvgren, alphonse mucha, intricate detail fluffy fur, shortstack ((anthro)) (fox) female solo, cloth, Japanese kimono, furry fuzzy cleavage, bushy tail ears, cute adorable expression, extremely detailed digital painting

Negative prompt: tall, bra, deformed mutated disfigured hands, patreon, watermark, male gay penis knot balls intersex herm nipples, nude, text, fursona, simple background, sketch, comic, out of frame

Steps: 20, Sampler: Euler a, CFG scale: 12, Seed: 3647515668, Size: 512x512, Model hash: 6d8fba3b

獣人にするためのテクニックについては特に書くことが無くなった感じはしますが、ちょっとしたテクニックなんかはまだ書くことがありそうです。

ただ、VRChatのイベント、バーチャルマーケット2022 Winterへ出展することになり、そちらの作業で忙しくなりそうなのでしばらくはnoteの記事は書けないかもしれません…

息抜きに簡単な記事くらいなら書けるかなぁ…

この記事が気に入ったらサポートをしてみませんか?