見出し画像

Stable Diffusion で可愛い女の子を出すコツ(プロンプトやパラメータなど)


はじめに

この記事では、Stable Diffusion WebUI(以下SD)の初心者の方を対象として、シンプルなプロンプト(呪文)で可愛い女の子を生成するための方法を解説したいと思います。この記事のヘッダー画像も今回ご紹介するプロンプトやパラメータ設定で生成した画像の中の1枚になります。

私もSDを使い始めた頃は、プロンプトの書き方にはかなり苦労しました。ただ、最近ではそこまでプロンプトにこだわらなくても、ポイントさえ押さえておけば、かなり可愛い女の子を出すことができるようになりました。

以下で紹介しているような画像をすでに生成できる方は、この記事から得るものはないと思います。

サンプル画像10枚

まずは、「ChillyMix」というモデルを使用した画像を5枚ご覧ください。すべて同じプロンプトから生成しています。
元の画像はもう少しクリアなのですが、noteにアップすると画質が少し落ちてしまうようです。

ChillyMix_01.png
ChillyMix_02.png
ChillyMix_03.png
ChillyMix_04.png
ChillyMix_05.png

次に、「mutsuki_mix」というモデルを使用した画像を5枚ご覧ください。こちらもプロンプトはまったく同じです。年齢設定は同じなのですが、こちらのモデルは全体的に幼い印象になりますね。

MutsukiMix_01.png
MutsukiMix_02.png
MutsukiMix_03.png
MutsukiMix_04.png
MutsukiMix_05.png

いかがでしょうか。同じプロンプトを使用しても「Generate」ボタンを押すたびに、いろいろなバリエーションの顔が生成されるのがお分かり頂けると思います。つまりガチャ要素があるということです。これが画像生成AIの醍醐味でもあり、面白いところでもあります。

ちなみに、「おまけ1のトピック」で紹介しているアップスケーラを使用すると、以下のように高解像度化することができます。

AIによる超高解像度化を実行

それから、プロンプトの説明に入る前の準備として、VAEの設定をしていない方は以下の解説記事を参考にして事前に済ませておきましょう。VAEを設定しておくと画像が高品質になります。

・Stable Diffusionで必須のVAEとは?初期設定と使い方を解説!

お待たせしました。前置きが長くてすみません。
それでは、今回使用したプロンプトの解説をしたいと思います。

なお、モデルやLoraの適用方法については知っているものとして解説を進めていきますので、ご了承ください。


使用したプロンプトの説明

今回使用したモデルについてですが、私は以下の2つを使用しています。どちらも可愛い日本人女性を出すにはお勧めだと思います。おそらく一番人気だと思われる「ChilloutMix」を使用しても問題ないと思います。

・ChillyMix

・mutsuki_mix

今回使用したプロンプトは以下の通りです。
(3 girls:1.2), cute girls stand with smile, (20 yo:1.2), casual dress, hair ornaments, jewelry, park, uhd, RAW, sharp focus, (photorealistic), best quality, ultra high res, (masterpiece), short hair, (flat chest:1.4), (arms behind back:1.2), <lora:xiaoshazi:0.3>,

「(3 girls:1.2)」のようにカッコを付けて数字を併記すると、その語句の意味を強めに反映してくれます。もちろん絶対ではありませんが・・・
「(20 yo:1.2)」というのは年齢指定で「(20 years old:1.2)」の省略形です。

次に、ネガティブプロンプトは、、、
nsfw, paintings, sketches, (worst quality, low quality:2), bad anatomy, bad hands, monochrome, grayscale, missing fingers, extra digit, fewer digits, cropped, negative_hand-neg, (large breasts:1.6), jpeg artifacts, signature, watermark, blurry,

上記のプロンプトに含まれている「negative hand-neg」を使用する場合には、以下の解説記事を参考にして導入しておきましょう。これも手指の破綻を防ぐためのものです。

その他のパラメータは、、、
Steps: 30, Sampler: DPM++ 2M Karras, CFG scale: 7, Seed: 3708683599, Face restoration: CodeFormer, Size: 768x768, Model hash: 33be76cb88, Model: chillymix_V2Fp16, Lora hashes: "xiaoshazi: 9d82c7787e79", Version: v1.4.0

可愛い日本人の女の子を出すために、いろいろなLoraを試した方も多いと思います。有名なのは以下のようなものです。

・JapaneseDollLikeness

・KoreanDollLikeness

しかし、今回はこれらのLoraは使用していません。使用するのは以下のものだけです。プロンプトの中で「<lora:xiaoshazi:0.3>」と指定しているところです。

・ChilloutMixss

また、プロンプトの欄には、JapaneseやKoreanなどの語句をまったく使用していません。「<lora:xiaoshazi:0.3>」だけでも冒頭のサンプル画像のように日本人っぽくなってくれます。
最初の頃は私も「<lora:JapaneseDollLikeness_v15:0.2>」や「<lora:koreanDollLikeness_v20:0.3>」などをいろいろと組み合わせて指定していましたが、結局これらを入力しなくても可愛い女の子は生成できました。

また、画像生成AIあるあるですが、指先がよく破綻してしまいます。指の本数が多過ぎたり少な過ぎたり。せっかく綺麗な顔が生まれたのに指先が破綻していて「クッソー!」となることがあります。
これを何とか抑制するために、私はよく「(arms behind back:1.2)」という語句を入れています。「破綻するくらいなら、手を後ろで組ませてしまえ!」というわけです。(笑)

あと、AIは巨乳好きなのか、胸が大きくなり過ぎることがあるので、私は「<(flat chest:1.4)>」(ペチャパイ推奨)としています。同時にネガティブプロンプトの方にも「<(large breasts:1.6)>」(巨乳禁止)のようにしています。ここまで指定して、ようやく普通の胸になります。

パラメータの説明

それから、パラメータの調整でもいくつか重要なことがあります。
「サンプリングメソッドの設定値」は「DPM++ 2M Karras」をメインで使用しています。
「サンプリングステップの設定値」はデフォルトは「20」ですが「30~40」に変更しています。
あと、「Restore faces」という項目は必ずオンにしています。これがオフのままだと顔の作りがイマイチになってしまいます。(化粧前と化粧後くらいの差があります)

だいたいこんな感じでしょうか。
これらのポイントを押さえておけば、可愛い女の子が生成できると思います。画像生成AIはガチャ要素があるので、あとはひたすら「Generate」ボタンを押して当たりが出るのを楽しみに待ちます。

それでは、楽しいSDライフを送りましょう!
ここまでご覧いただきましてありがとうございました。

おまけ1(画像のアップスケーリング)

SDで画像を作成する際には、画像サイズとして「512x768」や「768x768」などを指定することが多いと思います。
これらの画像をアップスケーリングするのに便利なソフトをご紹介します。
ここで言うアップスケーリングとは、単なる画像のリサイズではなく、AI技術を使用した超高解像度化を行う処理のことです。
このソフトを使用すると、冒頭でご紹介した画像を以下のように高解像度化することができます。基本的には縦横を4倍に拡大します。

ただし、このソフトはVulkanに対応したGPUが必要です。私が使用しているノートPCは「NVIDIA GeForce MX150」という非力なGPUしか積んでいませんが、それでも動作してくれました。
ちなみに、画像1枚をアップスケールするのに、約30~50秒くらいかかります。

noteの画像で違いが分かるか微妙ですが、Before/Afterをお見せします。
ちょっと分かりにくいですが、白い縦線の左側がBeforeの表示、右側がAfterの表示となっています。

アップスケール前
アップスケール後
アップスケール後のフル画像

このソフトは「Upscayl」というフリーソフトになります。インストール方法や使い方は下記の記事を参考にしてみてください。

・画像をAI の力で高解像度化する!「Upscayl」

おまけ2(プロンプトを確認するソフト)

SDには「PNG Info」というタブがあり、そこに生成した画像をドラッグ&ドロップすると、プロンプト情報などの詳細を確認することができます。
しかし、私のようにWebUI版を使用している場合、ちょっと画像のプロンプトを確認したい、というような時にいちいちSDを起動するのはとても面倒です。私はPaperspaceを利用しているので、起動するのに3~5分くらいかかります。しかもFree-GPUに空きがなければ起動すらできません。

そんな時に便利なのが「SD Prompt Reader」というソフトです。このソフトはスタンドアロン形式のソフトですので、単独で起動することができます。
あとは、確認したい画像をドラッグ&ドロップするだけで、プロンプト、ネガティブプロンプト、パラメータなどを表示してくれます。

・簡単にメタデータを確認できる軽量の外部ツール「Stable Diffusion Prompt Reader」の紹介!

以上です。

この記事が気に入ったらサポートをしてみませんか?