見出し画像

【盲点】プロンプトの文字数が長くなるほど、イラストのクオリティが下がる「ワースト1位」の原因について…【StableDiffusion】

ChatGPTからAIイラストに入った私にとっては、盲点でした。
なぜなら彼は、自動で”それ”を選定してくれていたからです。

原因

サイズです。
デフォルトの512pxでは、画素数が足りないのです。

前提

今回は、プロンプトが長い=全身を書こうとしていると定義します。

プロンプトを沢山書くということは、画素数がたくさん無いと書けないような内容になっていることが多いです。

しかし、どんなにいいプロンプトを書いても、画素数が少なすぎると書くことができません。

例えば、私たちが64pxの広さに全身を書こうとしても無理なわけです。
ピクセルアートで書くか、ディティールを落として書くしかありません。

解決

適切なサイズを選択してください。
目に見えてクオリティが上がります。

上の3枚が512px
下の3枚が1024pxです。

ズームしたものです。

適切なサイズ

下記に目安を書いています。

目安

イメージで言うと、最小単位を256pxとして増減させます。

[256],[256] - 目だけ等、または、プロンプトテスト用
[512],[512] - 顔~胸辺りまで
[512],[768] - 腰辺りまで
[1024],[1024] - 全身のTポーズ
[2048],[2048] - 大人数と風景のような、超美麗作品

サイズが小さすぎる時

サイズに対して書く量が多いとAIが判断したら、

  • 全体的に書き込みが甘くなる

  • 指示を無視しやすくなる

というような傾向のイラストを生成するようになります。
画素数が少なすぎて、描くのが物理的に不可能なのです。

サイズが大きすぎる時

サイズに対して書く量が少ないとAIが判断したら、

  • 頼んでないものを書く

  • 人数が増える

  • 手足をたくさん生やす

というような傾向のイラストを生成するようになります。
どうしても空白を埋めようとする本能を持っているからです。

T-ポーズ指定を外したら、空白を埋めるために二人になりました。

アップスケール

Hires fixという、構図の破綻を回避しつつ高解像度の画像が生成できるStable Diffusionのオプション機能があります。

理想

画素数を上げて、その画素数に見合ったディティールにしてくれる。

現実

私の技術では、画素数が上がるだけでした。
オススメのアップスケールモデルがあれば教えてください…

原理

元となるイラストがある程度クオリティがないと、低クオリティのイラストを鮮明にするだけになってしまいます。

使用モデル

checkpointに使ったモデルです。

まとめ

画素数の問題で上手くいかない人を救えたらいいなと思います。

この記事が気に入ったらサポートをしてみませんか?