Stable Diffusion | 自分用プロンプトまとめ

AI画像生成に欠かせない、プロンプトについてまとめていきます。
勉強したことの自分用まとめnoteです。


プロンプト(呪文)とは

プロンプトとは、こちら側の要望です。描いてほしい絵の注文内容をプロンプトといいます。

プロンプトを細かく指定すれば、より想い通りの画像が仕上がります。例えば、スタバの注文で「コーヒーください」より「ソイラテ、アイス、氷少なめで」と伝えた方が好みのコーヒーが手に入ります。AI画像生成のプロンプト同じです。
AI画像生成で、プロンプトが要なことがわかります。

AIに欲しい画像を伝えるときに、プロンプトの書き方のルールがあります。独自のルールに従えば、魔法のように画像ができることから呪文(プロンプト)と呼ばれることもあります。

プロンプトの組み立てかた

書き方のルールとコツ

  1. 英単語で書く(「a」「the」などの冠詞は省略)

  2. カンマ(,)+半角スペース で区切ってつなげる 例: girl, medium heir, almond eyes

  3. 優先度が高い順に並べる

  4. 単語(トークン)数は原則75トークン

1.英単語で書く
英語が苦手でも大丈夫。翻訳ツールやChatGPTを使えば簡単です。

2.カンマ(,)+半角スペース で区切ってつなげる
単語同士をカンマ(,)+半角スペースで連結すればプロンプト完成です。

3.優先度が高い順に並べる
さいしょの単語が優先され、後ろの単語ほど無視されやすいと言われています。

4.単語(トークン)数は原則75トークン
75文字以上を続けて羅列すると、誤認識を起こし生成に悪影響が出ます。その場合、75トークンごとに改行し、次の行の先頭に「BREAK, 」と入力しさらに改行して続きを書きます。※「,」も1単語でカウント

プロンプトのヒント

これらの要素を加えると、より質の高い画像生成ができます。
※全て入れる必要はありません

プロンプトに入れる7要素

  1. 品質

  2. コアプロンプト

  3. 追加要素

  4. 背景

  5. アートスタイル

  6. 構図

  7. 照明やフィルタ

1.品質

best quality (最高品質)、masterpiece (傑作)、ultra detailed (細部まで表現)、insanely detailed (最高傑作)など

品質ワードは、画像全体の品質を決定するプロンプトです。これを加えるとクオリティが上がりやすいです。

2.コアプロンプト

a girl (1人の女の子)、beautiful background illustration (美しい風景画)、a dog(1匹の犬)、cool guy (イケメン)など

コアプロンプト=描いて欲しいものです。何を書いて欲しいのか?主役を表すプロンプトです。

3.追加要素

looking at viewer (カメラ目線)、bangs (前髪)、smile (笑顔)、school costume (学生服)、long face (面長)など

追加要素は、コアプロンプトを補足する単語です。主役が人物なら、髪型や服装、表情など。主役が風景画像なら、そこに映る建物の特徴、小道具、動物など。

4.背景

no background (背景なし)、in cafe (カフェ)、spring scenery (春の景色)、on the bed (ベッドの上)など

背景は、そのまま画像の背景や主人公のいる場所のプロンプトです。

5.アートスタイル

3D render (3D CG )、Pablo Picasso style (ピカソのような)、illustration (イラスト)、cel anime (アニメ風)など

アートスタイルは画風を決めるプロンプトです。画像の雰囲気が大きく変わるプロンプトです。

6.構図

Full shot (全体像)、Close-up shot (顔のアップ)、POV (撮影者の視点から)、Low angle shot (低視点から)など

構図は、カメラと被写体の距離を指定したり、カメラアングルなどのプロンプトです。

7.照明やフィルタ

cinema lighting(映画のような)、low contrast (明暗の差が少ない)、Shallow depth of field (被写体の一部にピント)など

照明やフィルタは、携帯の画像加工のようなプロンプトです。

ガチャと言われる理由

どんな画像になるかはプロンプト次第です。
その上で、AIがどんな画像を生成するかは運しだいな一面があります。
まるで、ガチャぽんを回し、何が出てくるかお楽しみ的な感じです。

自分好みの画像が生成されるまで、ガチャを回し続けたり、コアプロンプトに要素を足したり引いたり。案外、地味な作業です。トライ&エラーを繰り返しながら理想の画像が出てくるのを待ちます。

ネガティブプロンプトってなに?

生成して欲しくない要素をネガティブブロンプトと言います。
例えば、女の子の画像生成している最中に、突然メガネをかけたバージョンが生成されます。メガネをかけて欲しくない時には、ネガティブプロンプトにglasses (メガネ)と指定することで、メガネバージョンの登場確率が下がります。

ネガティブプロンプトを使わずとも画像生成はできますが、失敗画像の登場を減らし、最短で狙った画像を出すためには必須です。

プロンプトのテクニック

強調(Prompt weight)

プロンプトを、強調したいときに使うテクニックです。
プロンプトに「重み(weight)」と付けることで優先度が上がります。

  • プロンプトを()で囲む

  • 数字を付与する

例:(((medium heir))), best quality, japanese girl, (RAW photo:1.2)…….

さいごに

Stable Diffusionで画像生成をするため、プロンプトについてまとめました。習うより慣れろ。
頭ではなく手を動かすことで「自分の課題」が見つかるはずです。
まずは課題を見つけるために画像生成を繰り返すのみです。




この記事が気に入ったらサポートをしてみませんか?