見出し画像

そうだ!AI画像生成をちゃんと勉強しよう💡4章:プロンプトについて(後半戦)

※勉強しているのは、Stable Diffusion、SeaArt系になります。

後半戦もがんばっていきましょう!
本日も等身大の私ですよろしくお願いします(*⩌⩊⩌*)



おさらい

前半戦は、
プロンプトの基本構文や、書き方の形式の種類みたいなのと、
肯定的なプロンプト、否定的なネガティブプロンプトがあることを覚えました。
そしてネガティブプロンプトの威力と大切さに気づきました😫


ユニバーサルプロンプト式

私はユニバーサルプロンプト式というものをはじめて聞いたのですが、ChatGPTくんいわく、

「幅広い用途やスタイルに適応可能な汎用的なプロンプトのことです。
これは、さまざまな画像生成シナリオにおいて一貫した結果を得るために設計されています。
このようなプロンプトは、具体的かつ詳細な指示を含み、画像生成AIが意図を正確に理解しやすくするために以下の要素を含むことが一般的です。」

だそうです。
まあ、私はこれを聞いてもよくわかりませんでしたけど…😂

もう少し聞いたらこうに答えてくれました。

ChatGPTくん
「さまざまな画像生成ツールやモデルに対して一貫した結果を得るために設計されたプロンプトのことです。つまり、特定のツールに依存せず、広範囲のツールやモデルで適応可能なプロンプトです。以下に具体的な意味と目的を説明します。」


汎用的なプロンプトの具体例と特徴


  1. ツール非依存性:

    • どの画像生成ツールでも同じように解釈されるように設計されています。

    • 例:Stable Diffusion、DALL-E、MidJourneyなど。

  2. 具体的かつ明確な指示:

    • ツールが生成すべき画像を正確に理解できるように詳細な記述を含む。

    • 例:「A sunset over a calm ocean with pink and orange hues reflecting on the water.」

  3. 柔軟性:

    • 幅広いシナリオに適用可能で、ツールやモデルの性能を最大限に引き出す。

    • 例:リアルな風景画からアニメ風のキャラクターまで。

  4. 一貫性:

    • 複数のツールで同じプロンプトを使用しても、似たような結果が得られるように設計されている。

    • 例:どのツールでも特定のシーンやスタイルが同じように表現される。

私なりにまとめると、どのAI画像生成ツールにも対応できるオールマイティーなプロンプト構成という感じかな。
この構成覚えておけば間違いないみたいな✨


ユニバーサルプロンプトの要素


ユニバーサルプロンプト式の構成はというと、

主題、背景、スタイル、カラー、詳細、感情や雰囲気

の要素を含むことが一般的らしいです。
具体的には、

  1. 主題(Subject):

    • 描きたい主な対象物やキャラクター。

    • 例:「A serene mountain landscape with a clear blue sky」

  2. 背景(Background):

    • 主題の後ろにある背景や環境の詳細。

    • 例:「In the background, there are towering pine trees and a gently flowing river」

  3. スタイル(Style):

    • 画像のスタイルやアートの種類(例:写実的、アニメ風、抽象画など)。

    • 例:「in a realistic style with high detail」

  4. カラー(Colors):

    • 使用したい主要な色やカラーパレット。

    • 例:「using a pastel color palette with soft hues of blue and green」

  5. 詳細(Details):

    • 具体的なディテールやアクセント。

    • 例:「with small flowers blooming along the riverbank and a few birds flying in the sky」

  6. 感情や雰囲気(Emotion/Mood):

    • 画像が伝えたい感情や雰囲気。

    • 例:「evoking a sense of peace and tranquility」

このような感じです。


ユニバーサルプロンプトの例

以下は、上記の要素を組み合わせたユニバーサルプロンプトの例です。

A serene mountain landscape with a clear blue sky. In the background, there are towering pine trees and a gently flowing river. The image is in a realistic style with high detail, using a pastel color palette with soft hues of blue and green. There are small flowers blooming along the riverbank and a few birds flying in the sky, evoking a sense of peace and tranquility.

ユニバーサルプロンプトの例

訳すと、

澄み切った青空が広がる穏やかな山の風景。背景にはそびえ立つ松の木と穏やかに流れる川。青と緑の柔らかな色合いのパステルカラーを使い、細部まで写実的なスタイルで描かれている。川岸には小さな花が咲き、空には数羽の鳥が飛び、平和と静けさを感じさせる。

上のユニバーサルプロンプトの例の日本語訳

このように、ユニバーサルプロンプトは具体的で詳細な記述を通じて、AIがユーザーの意図を正確に理解し、期待通りの画像を生成するのに役立ちます。

(GPTくんありがとう)

理解できたところで、GPTくんが出してくれたユニバーサルプロンプトの例を実際に使ってみたいと思います。

私はMidJourneyには課金していないので(すごくしたい)DALL-E 3とStable Diffusionで試してみます。

DALL-E 3で生成

ユニバーサルプロンプト例で生成した画像1-1


Stable Diffusionで生成

今回モデルは ponyDiffusionV6XL、サンプラーは Euler a を使いました。

ユニバーサルプロンプト例で生成した画像1-2

似た構図の絵が作られましたね👀
ユニバーサルプロンプトも覚えたら汎用性が高くてとても使えそうです✨

問題は語彙りょ…_( :⁍ 」 )_


強調プロンプト

プロンプトは強調という手法もあります。
そして強調することを「重みをつける」といいます。

重みの値が高いほど、そのプロンプトが優先され対応する情報がより多く反映されます。
逆に重みを減らすとその情報の表現は少なくなります。

強調の方法には2種類あって、括弧の数で制御する方法と、
数値を直接入力する方法があります。


プロンプトの重みづけの基本的な書き方

  • 丸括弧 ( ) : 軽い重み付け(デフォルトは1.1倍)

  • 二重丸括弧 (( )) : 強い重み付け(デフォルトは1.21倍)

  • 角括弧[] : 重みを下げる(デフォルトは0.91倍)

  • カスタム重み : (word:1.5)のように、明示的に重みを指定する


重みづけの検証

A beautiful landscape with majestic mountains
(雄大な山々のある美しい風景)

このプロンプトをつかって、重みづけでどのように生成結果が変わるのか検証してみたいと思います。

Stable Diffusionを使用します。
モデルは ponyDiffusionV6XL、サンプラーは Euler a です。

前回ネガティブプロンプトの偉大さを覚えたので今回はこちらのネガティブプロンプトも入れてみてます!
EasyNegative,worstquality,low quality,normal quality
(イージーネガティブ、最悪の品質、低品質、通常の品質)

重みづけなし

A beautiful landscape with majestic mountains

軽い重みづけ

「雄大な山々」に軽い重みづけがされている。

A beautiful landscape with (majestic mountains)

強い重みづけ

「雄大な山々」に強い重みづけがされている。

A beautiful landscape with ((majestic mountains))

重みを下げる
「雄大な山々」の重みが下げられている。

A beautiful landscape with [majestic mountains]

カスタム重み

プロンプト:A beautiful landscape with (majestic mountains:1.5) and (tiny flowers:0.5)(雄大な山々と小さな花々が織りなす美しい風景)

「雄大な山々」 に1.5倍の重みが、「小さな花々」 に0.5倍の重みが付けられている。

A beautiful landscape with (majestic mountains:1.5) and (tiny flowers:0.5)

重みづけを変えると結構変化があるんだなーと思いました。
これは後でまた色々実験したいですね ♪


前半戦、後半戦と学んできました。
だいぶプロンプトについて理解できたような気がします。
あとはどんなプロンプトがあるのかとか、追々調べていきたいと思います!

毎度のことですがこちらのガイドブックで勉強させてもらっています👇
みなさんもよかったら読んでみてください( • ̀•́ )✧




今日のサムネ生成過程(ChatGPT,DALL-E 3)


私「そうだ!AI画像生成をちゃんと勉強しよう💡4章:画像生成におけるプロンプト(後半戦)というタイトルのnote記事を書きました。 このタイトルに合うような画像を作ってください。 要望は、日本の少女漫画のようなタッチで、水彩画のようなカラーリングで16:9で描いてください。」

ChatGPTくん「こちらが「そうだ!AI画像生成をちゃんと勉強しよう💡4章:画像生成におけるプロンプト(後半戦)」のタイトルに合うイラストです。日本の少女漫画のようなタッチで、水彩画のようなカラーリングで描かれています。ご確認ください。」

私「女の子は今までと同一人物で描いてください」

ChatGPTくん「こちらが「そうだ!AI画像生成をちゃんと勉強しよう💡4章:画像生成におけるプロンプト(後半戦)」のタイトルに合うイラストです。同じ女の子が描かれています。ご確認ください。」

この画像を添付

私「この女の子を主人公にします。覚えたら、了解と返事をしてください」

ChatGPTくん「了解しました。この女の子を主人公にして、次のイラストを作成します。準備ができたら教えてください。」

私「「そうだ!AI画像生成をちゃんと勉強しよう💡4章:画像生成におけるプロンプト(後半戦)」というタイトルのnote記事を書きました。 このタイトルに合うような画像を作ってください。 要望は、日本の少女漫画のようなタッチで、水彩画のようなカラーリングで16:9で描いてください。」

ChatGPTくん「こちらが「そうだ!AI画像生成をちゃんと勉強しよう💡4章:画像生成におけるプロンプト(後半戦)」のタイトルに合うイラストです。ご確認ください。」

(・・・。)
私「もう少しシンプルな絵にしてください女の子ももう少し可愛くしてください」

ChatGPTくん「こちらが「そうだ!AI画像生成をちゃんと勉強しよう💡4章:画像生成におけるプロンプト(後半戦)」のタイトルに合う、シンプルで可愛らしいイラストです。ご確認ください。」

私「(悪くない…悪くないんだけど、、髪型と服が気になる…)女の子はロングヘアにして、淡い色の水彩画にしてください。16:9で。」
服はワンチャン変わるかなと思って一旦保留。

ChatGPTくん「こちらが「そうだ!AI画像生成をちゃんと勉強しよう💡4章:画像生成におけるプロンプト(後半戦)」のタイトルに合う、ロングヘアで淡い色の水彩画風のイラストです。ご確認ください。」

私「(うんうん、あとは服だな)」
ペンで服だけ選択
私「夏服に変えてください」

ChatGPTくん「こちらが夏服に変更したイラストです。ご確認ください。」

私「ナイスです!!」

以上~。


(2024.8.2追記)

おまけの成果ギャラリーvol.4

SeaArtに出会う

※足とか腕とかが多い画像があります。苦手な方はご注意ください🙏

色んなAIツールを調べてるときにSeaArtも見つけました。
数ある画像生成ツールの中でなぜSeaArtをいじり始めたかというと、
”タスクでポイントがもらえるから”でした。


この記事が参加している募集

この記事が気に入ったらサポートをしてみませんか?