見出し画像

たった1文からChatGPTと美麗なAI画像を作る

こんにちは。noteでは初めまして✨ももはです!
この記事はStableDiffusionのプロンプトを出力するためのChatGPTのプロンプトをテンプレート化し公開します。
このテンプレートを使えば、日本語でChatGPTにたった1文の簡単なテーマを与えるだけで美麗な画像を生成するStableDiffusionのプロンプトが作れるようになりますよ!

はじめに

この手法の元ネタは @br_d さんのこちらの記事です。インスピレーションを与えてくださったことにお礼申し上げます。
https://br-d.fanbox.cc/posts/5677780
(2023/6/4追記:URLを修正しました)
そこから自分なりに拡張した結果をメモしておくことで、今後ChatGPTを画像生成に役立てたい方のヒントになればと思います。

(2023/6/4追記)
時を同じくしてものすごいChatGPT × jsonの手法が編み出されています!
ももはのテンプレートと、NyaFuさん、BDさんによるプロンプト調整手法を組み合わせると、画の創造性とシーンのコントロールに強力な力を発揮するようです。
こちらもぜひチェックしてみてください✨
https://note.com/br_d/n/n822a6883cd2e

生成した画像の実例

それでは、今回公開するテンプレートを用いた画像をご紹介します。
テンプレートからこれらの多彩な画像を出力するために、変更するのはテーマだけ。1行です。
テーマに基づいた画像の構成要素を、全てChatGPTが考えてくれるのです。
それぞれの画像について、テンプレートに指定したテーマを記載します。

テーマ「きらびやかな錬金術師」

テーマ「きらびやかな錬金術師」

テーマ「1930年代のスパイをテーマにした大人向けの物語」

テーマ「1930年代のスパイをテーマにした大人向けの物語」

雄大な景色や、美しいポートレートも出力可能です。
テーマ「きらびやかな宝石、子供向けの物語」

テーマ「きらびやかな宝石、子供向けの物語」

テーマ「リラックスした、アイドルの個性あるポートレート」

テーマ「リラックスした、アイドルの個性あるポートレート」

リアルで印象的な画像からは、登場人物の心情まで読み取れるようです。
プレーンなt2i + 引きの顔の部分だけi2iで高精細化 + 画像全体をアップスケールしました。

全くテーマの異なる4枚のプロンプトですが、実は同じ方法で作成しました。
ChatGPTにお願いして、StableDiffusionのプロンプト(以下SDプロンプト)のアイデア出しだけでなく、SDプロンプト自体を作ってもらう方法です。
このテンプレートを使用してChatGPTにテーマに沿ったアイデアを考えてもらうことで、すぐには思いつかないような複雑な要素を含んだプロンプトが作成できます。
景色や洋服、撮影効果などの描写が充実しており、しかも上記のような画像をテーマに従って何パターンも生成できます。

ひとつ注意点があります。
ChatGPTにそこそこ長い日本語プロンプト(以下ChatGPTプロンプト)を使ってお願いするため、GPTの性能によってSDプロンプトの完成度が変わってきます。
具体的には、無料で使えるGPT-3.5では「英単語形式でSDプロンプトの要素のアイデア出し」まで可能であることを確認しています。
サブスクリプションで使えるGPT-4は、さらに「出したアイデアをもとに英語の文章を作成し、SDプロンプトのひな型にはめ込む」ことができます。

3.5と4の違いは、ChatGPTプロンプトの詳細な指示にどれだけ従ってくれるかどうかです。
今回の手法では「SDプロンプトのひな型に文章をはめ込む」部分を忠実に実行してくれるのはGPT-4でした。
3.5をお使いの方は、アイデア出しにぜひChatGPTを使ってみてください。

プロンプトの実例

ChatGPTと協力したSDプロンプトの作成の流れはかなりシンプルです。
ChatGPTに今回公開する日本語のプロンプトテンプレートを入力して、指示通りSDプロンプトを出力してもらうだけです。
あとは、お好みのネガティブプロンプト、モデル等の設定と組み合わせて画像を出力してください。

このChatGPTに渡すプロンプトが重要です。詳細で具体的に説明するほどChatGPTが出力するSDプロンプトの内容が充実していきます。

ChatGPTプロンプトの実例(テンプレート)

これは上記の「きらびやかな錬金術師」を出力した時の実際のChatGPTプロンプトです。
とても文章が長いですが、最初の1行のテーマだけを編集すれば、残りは全部テンプレートとして使えます。

映画の登場人物写真のポートレート撮影をする設定です。衣装は必ずファッショナブルにしてください。きらびやかな錬金術というテーマで考えてみてください。
次の形式にのっとってください。1行は数単語で簡潔に表記してください。
xxの部分は英単語3~6語でお願いします。yyの部分はカンマ区切りの英単語で4つ記載してください。
英単語は写真に写るように具体的に記載してください。
衣装とその場所にあるものは具体的なアイテムを記載してください。
画像生成の性能に制限があるため、「人物が何をしているか」は人物についてのみ説明してください。背景の他のものと干渉するポーズは描写できません。
人物はshe/herと記述してください。

最も大切なのは人物を魅力的に描写する画像にすることです。

形式
物語のテーマ:xx
役柄:xx
人物が何をしているか:yy
表情:xx
場所:xx
その場所で写っているもの:yy
雰囲気:xx
レンズの設定や撮影効果:yy

次に、上で出たアイデアをプロンプトの形に成型してください。
プロンプトは単語の羅列部分と、文章で表す部分が混ざっています。以下のひな型を参考にしてかぎかっこ「」の部分を置き換えてください。
文章を指示されているところは、アイデアを表す詳細な描写をしてみてください。

プロンプトのひな型:
「次の要素を全て使って文章で記述:役柄, 人物が何をしているか, 表情」 BREAK 「次の要素を全て使って文章で記述:物語のテーマ, 場所, その場所にあるもの」 BREAK 「次の要素を全て使って文章で記述:雰囲気, レンズの設定や撮影効果」

成型されたプロンプトを出力してください。2つお願いします。

出力されたSDプロンプトの実例

こちらが実際のChatGPTの出力です。
そのまま画像生成に使えるプロンプトが2つ出力されています。

出力されたSDプロンプトはかぎかっこ「」の扱いがまちまちで、シングルクオーテーションになってしまっていますね。
実際に使用するときは、テンプレートの文中のかぎかっこ「」をダブルクォーテーションに置き換えてあげるとよりスムーズに変換されます。
ChatGPTは英語で学習されているので、日本語のかっこより英語のダブルクォーテーション""を使うとよいでしょう。

物語のテーマ:きらびやかな錬金術
役柄:錬金術師
人物が何をしているか:魔法の杖を握る, ローブを纏う, 錬金術の図面を見つめる, 薬瓶を手に持つ
表情:集中
場所:錬金術のラボ
その場所で写っているもの:本棚, 魔法の材料, 古いパーチメント, 魔法のグローブ
雰囲気:神秘的
レンズの設定や撮影効果:ソフトフォーカス, フレアエフェクト, ウォームトーン, シャドウエフェクト

プロンプト1:
「The character is an alchemist, gripping a magic wand, clad in a robe, studying alchemical schematics, and holding a potion vial. Her expression is one of concentration.'' BREAK ''Set in the universe of dazzling alchemy, the location is an alchemy lab, featuring a bookshelf, magical ingredients, old parchments, and a magical globe.'' BREAK ''The atmosphere is mystical, captured through a soft focus, flare effect, warm tones, and shadow effect.''

物語のテーマ:きらびやかな錬金術
役柄:魔法の宝石職人
人物が何をしているか:宝石を検査する, ファッショナブルなエプロンを着る, 眼鏡をかける, 笑顔を見せる
表情:喜び
場所:宝石工房
その場所で写っているもの:宝石作りの道具, 輝く宝石, デザインの図面, 鏡
雰囲気:創造的
レンズの設定や撮影効果:マクロレンズ, ブライトエフェクト, ヴィヴィッドカラー, 高コントラスト

プロンプト2:
「The subject is a magical jeweler, inspecting a gemstone, wearing a fashionable apron, donning glasses, and displaying a joyful smile.'' BREAK ''Within the context of dazzling alchemy, the setting is a jewelry workshop, with jeweler's tools, sparkling gems, design blueprints, and a mirror present.'' BREAK ''The atmosphere is creative, conveyed through a macro lens, bright effect, vivid colors, and high contrast.''

出力された「プロンプト1」をほぼそのまま使い、かぎかっこ「」などを無くしました。
顔を美しくするためにdetailed faceといった指定を加えたり、自分なりにアレンジすることも可能ですよ。

The character is an alchemist, gripping a magic wand, clad in a robe, studying alchemical schematics, and holding a potion vial. Her expression is one of concentration. BREAK Set in the universe of dazzling alchemy, the location is an alchemy lab, featuring a bookshelf, magical ingredients, old parchments, and a magical globe. BREAK The atmosphere is mystical, captured through a soft focus, flare effect, warm tones, and shadow effect.

日本語に翻訳すると、こんな意味です。

キャラクターは錬金術師で、魔法の杖を握り、ローブを着て錬金術の図式を研究し、ポーションの小瓶を持っています。 彼女の表情には集中力が表れています。 BREAK めくるめく錬金術の世界を舞台としたこの場所は、本棚、魔法の材料、古い羊皮紙、魔法の地球儀を備えた錬金術研究室です。 BREAK 雰囲気は、ソフト フォーカス、フレア効果、暖かい色調、シャドウ効果を通じて神秘的に捉えられています。

このプロンプトを一から作るのは難しいですが、ChatGPTと協力すれば、テーマを指定するだけで複雑なシーンを指定してくれます。
まるで、読んでいる本のワンシーンのようなドラマティックな画像を作れるのでとっても楽しいです。

実際に出力された画像がこちらです。ぜひ自分の好きなテーマでトライしてみてくださいね。

テーマ「きらびやかな錬金術師」

まとめ

今回はStableDiffusionのプロンプトを出力するためのChatGPTのプロンプトをテンプレート化し公開しました。
StableDiffusionとChatGPTを使ったことがない方はこの機会に使ってみてください。このテンプレートがあれば、お好きなテーマに沿って幅広く画像が生成できると思います。

この記事が役に立つと感じていただけたなら、下部にある「スキ(ハートマーク)」を押していただけるとうれしいです!
記事について疑問やお気づきの点がありましたら記事のコメントでお寄せください。

最後に

テンプレートの中身について詳細に解説する記事を書きました。
テンプレートの作成過程に加え、画像生成の領域におけるChatGPTとの協業あるいは利用方法、このテンプレートを生むための根底をなす考え方をご説明しています。
公開されているテンプレートを見て、画像生成のためのChatGPTの威力を感じられた方には、さらに踏み込んだテクニックとして役立てていただけると思います。
おまけにプロンプトも追加公開しています!

ぜひご覧ください✨
https://note.com/momo_ha_41/n/ne4d85f9b17e8

最後までお読みくださりありがとうございます!
画像生成を楽しみましょう✨


この記事が気に入ったらサポートをしてみませんか?