![見出し画像](https://assets.st-note.com/production/uploads/images/142838646/rectangle_large_type_2_fe9bc6ea7083f337ded22b69f76ca676.png?width=800)
プロンプト紹介:StableDiffusion差がはっきりわかるプロンプトの書き方
無料記事に全てプロンプトを載せます。有料記事は自由に出力を変更するためのプロンプトの変更方法などにとどまりますが、無料記事部分だけ読んでも変更方法はたいだい見当が付くと思います。
![](https://assets.st-note.com/img/1717394372598-b7uTzgsm8u.png?width=800)
subject:
- beautiful innocent girl,
- dramatic shadow,
- a giant Huge stone pillar and girls,
age: 26,
body-type:
- child-body,
- slender,
- small breast,
race:
- jpn,
wear:
- Thick winter jacket,
- leggings pants,
girl:
- charming intelligence eye cute lips,
- happy angelic face,
atmosphere:
- nostalgic,
- analog film,
quality:
- high detail realistic dramatic light and shadow,
- Ultra-high definition human skin,
ネガティブプロンプトはみなさんが普段お使いのを自由に指定してみてください。最近のモデルはネガティブプロンプトで品質コントロールをそこまでしなくてもいきなり高品質な絵が出力できるようになってきましたので、あとは雰囲気や味付けで充分かと思います。いちおう有償記事の部分に私の使用しているネガティブプロンプトも紹介しておきます。
使用モデルはSDXXXL v3.0。NSFWに特化したモデルなのでいろいろ考慮が必要(どうしても画質や品質が犠牲になっちゃうところもある)だけど、ぱっと思いついたプロンプトがすぐに結果として帰ってきやすさがあるので最近はSDXL系ではこのモデルをよく使っています。
さて、いきなりプロンプトは紹介しましたがたぶん多くの人が考えてるプロンプトと書き方が少し違うと思います。
これは、JSONとYAMLを変形したみたいな形で、コンピューターに指示を出しやすくかつプロンプトと親和性の高いところを目指して考えました。プロンプトを組み立てる人間もどこをどう動かせば何が変わるかわかりやすいのも良いところです。
StableDiffusionが一般的に発表された時からいろいろとプロンプトを研究(というとなんか言葉が強い気がするんですが他に適切な言葉も思い当たらず)してきた中で言えること、プロンプトの組み立てで活かせそうな特に大事なのが次の3つです。
プロンプトは文章を理解できない
単語と単語同士の距離が重要
改行は無視される(半角スペース一つと同じ扱いになる)
![](https://assets.st-note.com/img/1717394391975-WbNqiUqa67.png?width=800)
改行は無視される
3番目から話したほうが良いですね。プロンプトは改行を無視しますので、
shiba dog
shiba
dog
改行をいくつ書いても半角スペース一つと同じ扱いになりますので
shiba
dog
も当然同じです。半角スペースそのものも、いくつ繋げて書いても半角スペース一つとして扱われますので、
shiba dog
これも同じものになります。
なので、改行やスペースは積極的に利用して、プロンプトを人間が見てみやすいように作っていくのが、工夫のポイントになります。
単語と単語同士の距離
実際には英語でプロンプトは書きますが、ここではわかりやすく日本語のプロンプトで例を出してみます。
赤い ジャケットの 女性、 静かな 湖、夜になる直前、 古びた 小舟
「赤い」と「ジャケット」と「女性」は単語同士の距離が近いので(というより近接しあっている)お互いが影響を受けあいます。
「女性」と「静かな」の間には「、(本当は半角カンマ)」があるので、お互いの影響は少ないという指示になります。
「古びた」と「小舟」はこれも隣り合っているので影響を受けあいますが、「古びた」と「女性」は離れているので影響は少なくなります。ただしゼロにはなりません。プロンプトに「古びた」と出ている以上、少なからず「女性」にも影響は受けています。ただしその確認は人間には出来ません。
なのでプロンプトの組み立ては単語と単語の出現距離を意識しながら、影響が近い単語同士を固めていくことが重要になります。
プロンプトは文章を理解できない
midjourneyやDALL·Eはどうか私はわかりませんが、少なくともStableDiffusionは文章を理解できません。できるのはトークン化された文章と画像をベクトルで関連づけたCLIPに基づいてノイズを収束させることです。
なんか目くらましに使いそうな言葉で読者を混乱させているように思えるかもしれませんが、これ以上ここの説明の解像度を下げるわけにもいかずかといってこれ以上ここの言葉の正確性を失うわけにもいかない、とにかく説明が下手な私の悪いところです。もちろん、なんかややこしい言葉を使って、本当がどうか確かめようもない話で読者を煙に巻こうとしているわけではありません。
さてここから有料記事になりますが、内容は上記に挙げたプロンプトの変更方法などです。無料記事部分でだいたいの見当が付くと思いますが、もしそれでもサーバー代の応援したいという方や、もう少しだけノウハウの記事が読みたい方は購入を検討してもらえるととても嬉しいです。
ここから先は
¥ 1,200
この記事が気に入ったらサポートをしてみませんか?