見出し画像

Midjourney:プロンプト制作のための実践的ガイド

良いプロンプトの書き方を理解することは、求めているアウトプットを得るために役立ちます。

プロンプトを作成してくれる優れたUIツールもありますが、自分でプロンプトを変更、微調整、作成する能力は、あなたにとって有益なスキルです。このスキルを表す言葉として、"プロンプトクラフティング"や "プロンプトエンジニアリング"と呼ばれることがあります。

もちろん、ガイドラインに従わずに素晴らしい結果を得ることは十分に可能です。簡単な単語やフレーズだけで、美しい画像がレンダリングされるのを見たことがあります。しかし、一貫性を持たせ、出力を向上させたいのであれば、AIが言語パターンにどのように反応するかを学ぶ必要があるのではないでしょうか。

この記事では、私がプロンプトを書くときに使っている思考プロセスを紹介したいと思います。また、特定のAIアートツールにとらわれずに書いています。異なるツール間で構文に違いがあるかもしれませんが、書き方はほとんど同じです。以下の例では、Midjourneyで生成されたアートを紹介します。

プロンプトを作成する

私は、プロンプトを4つのグループに分け、特定の順序で考えるのが好きです(順序は、AIが出力に優先順位をつける方法に影響することに注意してください)。

  1. コンテンツタイプ

  2. 説明文

  3. スタイル

  4. コンポジション

それでは、プロンプトを書き出す過程で、それぞれを見ていきましょう。

1.コンテンツタイプ

作品づくりに取り組むとき、まず考えるのは、写真、ドローイング、スケッチ、3Dレンダリングなど、どのような作品に仕上げたいのか、ということです。

だから、プロンプトは、まずは以下のようにします。例えば写真なら、

A photograph of...

2.説明

説明とは、被写体、被写体属性、環境・シーンを定義することです。形容詞を使った説明文であればあるほど、より良いアウトプットになります。

つまり、被写体を簡単に説明すると以下のような感じです。

A photograph of a cat

しかし、より良い記述は、環境/シーンの記述と一緒に主題の属性を追加することです。

Pictures of full-bodied cats angry at home for asking to be fed. --v 5

3.スタイル

アートスタイルは表現に大きな影響を与えますが、私はスタイルを3つのサブカテゴリーで考えたいと思っています:

ライティングディテールアートスタイル

照明に使える言葉を紹介:

accent lighting, backlight, blacklight, blinding light, candlelight, concert lighting, crepuscular rays, direct sunlight, dusk, Edison bulb, electric arc, fire, fluorescent, glowing, glowing radioactively, glow-stick, lava glow, moonlight, natural lighting, neon lamp, nightclub lighting, nuclear waste glow, quantum dot display, spotlight, strobe, sunlight, ultraviolet, dramatic lighting, dark lighting, soft lighting
日本語訳)
アクセント照明、バックライト、ブラックライト、眩しい光、キャンドルライト、コンサート照明、クレパス光線、直射日光、夕暮れ、エジソン電球、電気アーク、火、蛍光灯、光る、放射能で光る、グロースティック、溶岩光、月光、自然照明、ネオンランプ、ナイトクラブ照明、核廃棄物の光、量子ドットディスプレイ、スポットライト、ストロボ、日光、紫外線、劇的照明、暗い照明、ソフト照明

作品のディテールは、シャープネスだけでなく、カメラレンズやデジタルレンダリングエンジンにも起因しています。

ディテールに使える言葉を紹介:

highly detailed, grainy, realistic, unreal engine, octane render, bokeh, vray, houdini render, quixel megascans, depth of field (or dof), arnold render, 8k uhd, raytracing, cgi, lumen reflections, cgsociety, ultra realistic, volumetric fog, overglaze, analog photo, polaroid, 100mm, film photography, dslr, cinema4d, studio quality

日本語訳)
高精細、粒状、リアル、アンリアルエンジン、オクタンレンダー、ボケ、Vray、Houdiniレンダー、キクセルメガスキャン、被写界深度、アーノルドレンダー、8kHD、レイトレーシング、cgi、ルーメンリフレクション、cgsociety、超リアル、体積霧、オーバーグラス、アナログ写真、ポラロイド、100mm、フィルム写真、DSLR、シネマ4d、スタジオ品質

アートスタイルは、さまざまな技法の説明であり、歴史的な芸術のジャンルとして定義することもできます。

ここでは、歴史的な アートスタイルにまつわる言葉を紹介:

Abstract, Medieval art, Renaissance, Baroque, Rococo, Neoclassicism, Romanticism, Impressionism, post-Expression, Cubism, Futurism, Art Deco, Abstract Expressionism, Contemporary, pop art, surrealism, fantasy

日本語訳)
抽象、中世美術、ルネサンス、バロック、ロココ、新古典主義、ロマン主義、印象派、ポスト表現、キュビズム、未来派、アールデコ、抽象表現主義、現代、ポップアート、シュールレアリスム、ファンタジック

ここでは、芸術的な技法や 素材に関する言葉を紹介:

Digital art, digital painting, color page, featured on pixiv (for anime/manga), trending on artstation, precise line-art, tarot card, character design, concept art, symmetry, golden ratio, evocative, award winning, shiny, smooth, surreal, divine, celestial, elegant, oil painting, soft, fascinating, fine art

日本語訳)
デジタルアート、デジタルペインティング、カラーページ、pixiv(アニメ・マンガ)特集、artstationトレンド、精密な線画、タロットカード、キャラクターデザイン、コンセプトアート、対称性、黄金比、喚起、受賞、光沢、滑らか、超現実、神、天、優雅、油絵、柔らか、魅惑、ファインアート

では、猫ちゃんプロンプトにスタイルを追加してみましょう。

Photo of an angry full-body cat taken in my apartment, dusk, Unreal Engine, 8K.

8kで自宅マンションが高精細に見えること、夕暮れ時に生じる低い太陽光から照明が薄暗いことがわかります。ちょっと猫がEpicのゲームでモデリングされているように見えないのは、少し失敗w

アーティスト名をスタイルに

アートスタイルに関しては、最も一般的な形で使用され、AIがとても気に入っているのは、アーティスト名を使用することであるようです。また、スタイルのバリエーションを探るために、複数のアーティスト名を使用することもよくあります。

Midjourneyコミュニティが管理するアーティストやスタイルの素晴らしいリソースはこちらをご覧ください。

そこで、猫のプロンプトをベースに、リソースシートから2人のアーティストを選び、アンリアル・エンジンを外して写真風に戻し、色として「セピア」を追加しました。

このように..プロンプトクラフトは、テキストインプットを継続的に変化させることで、アウトプットを洗練させ、再展開するものです。

Photo of an angry full-body cat in his apartment, by alex horley-orlandelli, by bastien lecouffe-deharme, dusk, sepia,8k,realistic --v 5

するとこんな感じに!

4.コンポジション

残りの要素はコンポジションで、これは...を指します。

アスペクト比カメラビュー解像度

アスペクト比 は 、特定の用途をターゲットにする場合にとても重要です。例えば、バナーを作る場合と、スクリーンセーバーを作る場合では、アスペクト比が異なります。

サイズによって異なるアスペクト比がどのように適用されるかを示す、素晴らしい資料です。

カメラビューは、画像の遠近感が重要です。あなたのアート作品は、クローズアップなのか、広角なのか、魚眼なのか、などなど...。

そこで問われるのは、視聴者の視点とは何かということです。

カメラ目線で使える言葉です:

ultra wide-angle, wide-angle, aerial view, massive scale, street level view, landscape, panoramic, bokeh, fisheye, dutch angle, low angle, extreme long-shot, long shot, close-up, extreme close-up
日本語訳)
超広角、広角、航空写真、巨大スケール、街並み、風景、パノラマ、ボケ、魚眼、ダッチアングル、ローアングル、超ロングショット、ロングショット、接写、超接写

解像度は、目指すディテール、クオリティ、サイズに当てはまると思います。解像度を表す言葉としては、以下のようなものがあります:

highly detailed, depth of field (or dof), 4k, 8k uhd, ultra realistic, studio quality.

日本語訳)
高精細、被写界深度(またはdof)、4k、8k uhd、超臨場感、スタジオ品質。

ツールベースパラメータの追加

MidJourneyには、出力をさらに工夫するためのコマンドパラメータがあります。

--beta = より高品質な出力を得るための新しい実験的アルゴリズム。
--no = 特定のオブジェクトを含めないというネガティブなプロンプト。
--s = stylize引数は、スタイライズの強さを設定します。
--q = 出力の品質を設定する
--chaos = 出力にランダム性を持たせるオプションを含む
--seed = 既にレンダリングされた特定の画像(各画像はユニークなIDを持っています)から出発点を設定します。これは、一貫したパースペクティブが必要な場合に最適です。

まとめ

このプロンプト作成が、あなたのお役に立てたなら嬉しい限りです。
プロンプトのアレンジの仕方がわかると、本当に楽しいですね。

私も最近はChatGPTよりMidjourneyにハマりっぱなしです!
TwitterでもMidjourneyに関する内容を発信しています。いいね、フォローしてもらえると泣いて喜びます!

この記事が気に入ったらサポートをしてみませんか?