【盲点】プロンプトの文字数が長くなるほど、イラストのクオリティが下がる「ワースト1位」の原因について…【StableDiffusion】

2024年4月1日 14:12

ChatGPTからAIイラストに入った私にとっては、盲点でした。
なぜなら彼は、自動で”それ”を選定してくれていたからです。

原因

サイズです。
デフォルトの512pxでは、画素数が足りないのです。

今回は、プロンプトが長い＝全身を書こうとしていると定義します。

プロンプトを沢山書くということは、画素数がたくさん無いと書けないような内容になっていることが多いです。

しかし、どんなにいいプロンプトを書いても、画素数が少なすぎると書くことができません。

例えば、私たちが64pxの広さに全身を書こうとしても無理なわけです。
ピクセルアートで書くか、ディティールを落として書くしかありません。

適切なサイズを選択してください。
目に見えてクオリティが上がります。

上の3枚が512px
下の3枚が1024pxです。

ズームしたものです。

下記に目安を書いています。

イメージで言うと、最小単位を256pxとして増減させます。

[256],[256] - 目だけ等、または、プロンプトテスト用
[512],[512] - 顔～胸辺りまで
[512],[768] - 腰辺りまで
[1024],[1024] - 全身のTポーズ
[2048],[2048] - 大人数と風景のような、超美麗作品

サイズに対して書く量が多いとAIが判断したら、

というような傾向のイラストを生成するようになります。
画素数が少なすぎて、描くのが物理的に不可能なのです。

サイズに対して書く量が少ないとAIが判断したら、

というような傾向のイラストを生成するようになります。
どうしても空白を埋めようとする本能を持っているからです。

Hires fixという、構図の破綻を回避しつつ高解像度の画像が生成できるStable Diffusionのオプション機能があります。

画素数を上げて、その画素数に見合ったディティールにしてくれる。

私の技術では、画素数が上がるだけでした。
オススメのアップスケールモデルがあれば教えてください…

元となるイラストがある程度クオリティがないと、低クオリティのイラストを鮮明にするだけになってしまいます。

checkpointに使ったモデルです。

画素数の問題で上手くいかない人を救えたらいいなと思います。

この記事が気に入ったらサポートをしてみませんか？