見出し画像

クオリティアッププロンプトがその他全体の要素に与える影響についての検証

 前書き

 こんにちは。こんばんは。
 水色の焦土です。

 先日こんな記事を書きました。
 わたしが普段使っているテンプレプロンプトを紹介し、その意図について解説したものです。

 正直あまり取り回しも可読性も良くないプロンプト構成になっていますが、わたしの意図を出来る得る限り反映した構成になるよう意識し組み立てたもので、その意図はそれなりの精度で反映されています。


 こちらは尊敬するBD氏の記事。
 とても有意義なことが沢山書かれていますので、是非読んで参考にしてみてください。

 というわけで、BD氏がBREAK構文を紹介してくださって以来、わたしもこの構文を多用しているわけですが、大きな要素ごと(わたしの場合ですと「クオリティアップ(画面構築)」「キャラ」「場所」「雰囲気(世界観)」「LoRAその他」)に区切るために使用しており、クオリティプロンプト単体が前後に与える影響というものについてはあまり深く考えてきませんでした。

 クオリティアッププロンプトが要素単体に対して直接的に影響を及ぼすのであれば、キャラ指定プロンプトを直下に置けばめちゃくちゃクオリティが高いキャラクターが生成されるわけですね。

 これは検証する価値があると思いましたので、実際にやっていこうと思います。

 キャラは固定しつつ、なるべく異なる画面構成になるプロンプトで検証していきます。


 検証方法

・使用環境

使用モデル、使用VAE、クリップスキップ数
各種設定(DPM++2M Karras v2の強度は0.30)

 上記の設定で、プロンプト部分を変更していきます。

 ネガティブプロンプト(固定)

EasyNegativV2:1.4
(worst quality:1.4, low quality:1.4) (bad anatomy:1.4, long body)
BREAK
(extra fingers, deformed hands, polydactyl:1.5) (logo, word, text, watermark)

(「検証6」のみネガティブプロンプトが違いました。検証への影響は少ないと思われますが、こちらも載せておきます)

EasyNegativV2:1.4
(worst quality:1.4, low quality:1.4) (bad anatomy:1.4, long body) (monochrome:1.2)
BREAK
(extra fingers, deformed hands, polydactyl:1.5) (logo, word, text, watermark)

ポジティブプロンプト(画面構成、キャラ部分を変更)

・パターン1

(absurdres:1.1, highres:1.1, ultra detailed:1.1) vintage photography, nostalgic atmosphere, fog:1.2
(high resolution:1.1, ray tracing:1.1, refraction:1.1) dynamic angle:1.1
BREAK
(1witch girl:1.3) expressionless (platinum silver hair, medium bob:1.35) (greeneyes:1.3) medium breasts

 以前に紹介したテンプレプロンプトそのまま

・パターン2

(absurdres:1.1, highres:1.1, ultra detailed:1.1) vintage photography, nostalgic atmosphere, fog:1.2
(high resolution:1.1, ray tracing:1.1, refraction:1.1) dynamic angle:1.1
(1witch girl:1.3) expressionless (platinum silver hair, medium bob:1.35) (greeneyes:1.3) medium breasts

 上記テンプレからBREAKを消したもの

・パターン3

(absurdres:1.1, highres:1.1, ultra detailed:1.1)
(1witch girl:1.3) expressionless (platinum silver hair, medium bob:1.35) (greeneyes:1.3) medium breasts
(high resolution:1.1, ray tracing:1.1, refraction:1.1) dynamic angle:1.1, vintage photography, nostalgic atmosphere, fog:1.2

 クオリティアッププロンプト直下にキャラ指定プロンプトを置き換えたもの。

 この3パターンで検証していきます。

 使用LoRA等に関してはわたしの上記の記事をご覧になってください。


 検証1

(absurdres:1.1, highres:1.1, ultra detailed:1.1) vintage photography, nostalgic atmosphere, fog:1.2
(high resolution:1.1, ray tracing:1.1, refraction:1.1) dynamic angle:1.1
BREAK
(1witch girl:1.3) expressionless (platinum silver hair, medium bob:1.35) (greeneyes:1.3) medium breasts
BREAK
High contrast, (solarization:1.3), inverted tones, surreal effect, otherworldly atmosphere, dreamlike quality
BREAK
High key lighting, (backlighting:1.2), pale tones, lens flare, soft focus, ethereal glow, dreamlike ambiance
BREAK
<lora:GoodHands-vanilla:1> <lora:epi_noiseoffset2:2.3> <lora:flatBG:-1.2> <lora:Silicon-landscape-isolation:0.15>
dark, rim lighting, nice hands, perfect hands, wakame
パターン1
シード値「4260585845」
パターン2
パターン3


 検証2

(absurdres:1.1, highres:1.1, ultra detailed:1.1) vintage photography, nostalgic atmosphere, fog:1.2
(high resolution:1.1, ray tracing:1.1, refraction:1.1) dynamic angle:1.1
BREAK
(1witch girl:1.3) expressionless (platinum silver hair, medium bob:1.35) (greeneyes:1.3) medium breasts
BREAK
(juxtaposition:1.1), unexpected combinations, bizarre imagery, thought-provoking contrasts, dreamlike scenarios, surreal symbolism
BREAK
(dystopian:1.1), oppressive atmosphere, bleak landscapes, decaying structures, dark tones, stark contrasts, haunting imagery, desolate mood
BREAK
<lora:GoodHands-vanilla:1> <lora:epi_noiseoffset2:2.3> <lora:flatBG:-1.2> <lora:Silicon-landscape-isolation:0.15>
dark, rim lighting, nice hands, perfect hands, wakame
パターン1
シード値「4260585833」
パターン2
パターン3


 検証3

(absurdres:1.1, highres:1.1, ultra detailed:1.1) vintage photography, nostalgic atmosphere, fog:1.2
(high resolution:1.1, ray tracing:1.1, refraction:1.1) dynamic angle:1.1
BREAK
(1witch girl:1.3) expressionless (platinum silver hair, medium bob:1.35) (greeneyes:1.3) medium breasts
BREAK
Long exposure, (motion blur:1.2), blurred movement, ethereal effect, dreamlike quality, surreal atmosphere
BREAK
(juxtaposition:1.1), unexpected combinations, bizarre imagery, thought-provoking contrasts, dreamlike scenarios, surreal symbolism
BREAK
<lora:GoodHands-vanilla:1> <lora:epi_noiseoffset2:2.3> <lora:flatBG:-1.2> <lora:Silicon-landscape-isolation:0.15>
dark, rim lighting, nice hands, perfect hands, wakame
パターン1
シード値「4260585834」
パターン2
パターン3


 検証4

(absurdres:1.1, highres:1.1, ultra detailed:1.1) vintage photography, nostalgic atmosphere, fog:1.2
(high resolution:1.1, ray tracing:1.1, refraction:1.1) dynamic angle:1.1
BREAK
(1witch girl:1.3) expressionless (platinum silver hair, medium bob:1.35) (greeneyes:1.3) medium breasts
BREAK
(panoramic:1.1), wide-angle view, immersive scenes, seamless stitching, vibrant colors, breathtaking vistas, expansive horizons
BREAK
divine forest, (enchanted flora):1.2, vibrant colors, exotic blooms, magical atmosphere, ethereal beauty, timeless tranquility, realm of the divine
BREAK
<lora:GoodHands-vanilla:1> <lora:epi_noiseoffset2:2> <lora:flatBG:-1.2> <lora:Silicon-landscape-isolation:-0.15>
dark, rim lighting, nice hands, perfect hands, wakame
パターン1
シード値「1284130900」
パターン2
パターン3


 検証5

(absurdres:1.1, highres:1.1, ultra detailed:1.1) vintage photography, nostalgic atmosphere, fog:1.2
(high resolution:1.1, ray tracing:1.1, refraction:1.1) dynamic angle:1.1
BREAK
(1witch girl:1.3) expressionless (platinum silver hair, medium bob:1.35) (greeneyes:1.3) medium breasts
BREAK
floating islands, magical waterfall, crystal formations, ancient ruins, swirling vortex, celestial bodies, arcane symbols, hidden realm
BREAK
<lora:GoodHands-vanilla:1> <lora:flatBG:-1.2> <lora:Silicon-landscape-isolation:0.15>
nice hands, perfect hands, wakame
パターン1
シード値「3455199921」
パターン2
パターン3


 検証6

(absurdres:1.1, highres:1.1, ultra detailed:1.1) vintage photography, nostalgic atmosphere, fog:1.2
(high resolution:1.1, ray tracing:1.1, refraction:1.1) dynamic angle:1.1
BREAK
(1witch girl:1.3) expressionless (platinum silver hair, medium bob:1.35) (greeneyes:1.3) medium breasts
BREAK
Coruscant-like planet, towering skyscrapers, flying vehicles, neon lights, bustling streets, holographic advertisements, advanced technology
BREAK
<lora:GoodHands-vanilla:1> <lora:flatBG:-1.2> <lora:Silicon-landscape-isolation:0.15>
nice hands, perfect hands, wakame
パターン1
シード値「91791319」
パターン2
パターン3


 検証結果

 以上が検証結果となります。

 結論としましては、試行回数の少なさはあれどパターン1とパターン3において「クオリティアッププロンプト直下にキャラクタープロンプトを配置しても、キャラクターに直接影響するような有意な結果」は、わたしの肌感覚では得られませんでした(何を以て「クオリティが高い」とするかは皆様の判断にお任せします)。
 なんとなく、検証前からこうなる気はしていました。

 パターン2に関しても同様の予測が立てられました。BREAKを排することで、やや遠景にキャラが置かれる場合が多いような気がします。モデルによってどう影響するかなどは未知数です。今回たまたまこういう結果に偏ってしまっただけの可能性も高いです。

 そもそも、なぜわたしがBREAK構文を多用し、プロンプト群を要素ごとに分けて記述していたのか、なぜそれについて考えてこなかったのかですが、クオリティアッププロンプトが具体的に何に影響するのかをある程度把握していたからに他なりません。

 恐らく、クオリティアッププロンプトは「生成物の画面全体」に影響します。

「masterpiece」というクオリティアッププロンプトを記述する前と記述した後で文字通りに「傑作的」に描き込みが増える要素とは、キャラクターだけに限りません。背景も等しく描写が増えるはずです。

 背景の描写が向上しないのであれば、それは「使用モデルが背景描写を苦手としている」のであり、「背景描写を得意とするモデル」を使用すれば背景の描写は一定水準まで向上するはずです(「CounterfeitV3.0」はとても優秀なモデルなのでオススメです)。

 モデルが持つ得手不得手のブーストを図るために使用するのが「masterpiece」などのクオリティアッププロンプトであり、クオリティアッププロンプトが何か特定の要素に「だけ」働きかけることはない、という実感はそれなりにAIイラスト生成を嗜んできた方々なら直感的に理解していることではないでしょうか。

 ということで、わたしはクオリティアップや画面構築、エフェクトなどのプロンプトをまとめて記述し、人物描写と混ぜたりせずに構築し、BREAK構文で区切りました。もちろんトークン数との兼ね合いという面も大きくあります。

 わたしが言えたことではありませんが、重要なのは、可読性とメンテナンス性だとも思っております。
 皆様もそれぞれにテンプレプロンプトや構築法をお持ちかと思われますが、読みやすく、自分がどこに何を配置したのかを整理してまとめられている方が、いざそのテンプレプロンプトを改良する時にも手が付けやすいと思われます。

 上記BD氏の記事においてBD氏も結論として挙げていらっしゃる通り、関連するものを1つのブロックに収納していく記述方式を、僭越ながらわたしも推奨致します。

 可能であればBREAK構文で区切った後に、要素の中で一番効かせたいプロンプトを最初に配置できると尚良さそうですね。

 今回の検証で言えばクオリティアップとキャラになりますが、外せない要素はトークンの最初に置くのが生成結果にブレが生まれず、無駄な試行回数を減らせてお得でしょう。

 わたしの検証法に限りますが、(absurdres:1.1, highres:1.1, ultra detailed:1.1)の後に(1witch girl:1.3)を置いているわけですから、少なからず(1witch girl:1.3)の優先度は下がるわけですし(わたしのオリジナルモデルでも検証しましたが、高確率で魔女の帽子が消失する結果が得られました。尚その現象が本当にプロンプトの優先順位で発生しているかどうかは、上記検証結果を見ればおわかりかと思いますが、不明です)、不確定要素は避けた方が無難でしょう。

 というのが、わたしの結論です。

 皆様におかれましても、良きプロンプトエンジニアリングを!

 以上で今回の検証を終わりと致します。

この記事が気に入ったらサポートをしてみませんか?