見出し画像

「GRAVITI Diffus」のt2i生成で注意すべき点

「GRAVITI Diffus」のt2i生成で注意すべき点が三つあります。

  1. [☑ Hirefx.fix] ※デフォルト選択状態

  2. [Batch size : 4] ※デフォルト選択状態

  3. Generate (Estimated use 20 credits) ※デフォルト消費credits

1つずつ解説します。


<Hires.fixは☑チェックを外す>

t2iで生成した画像を高品質でUpscaleします。
しかし、デフォルトで選択状態になっているため、有効化されたままの
状態でt2i生成した際に、出来栄えが悪い画像までもUpscaleされてしまい
Creditを余計に消費することになります。

Creditの消費を抑えるために一旦、機能を外すことをおすすめします。
まずは、満足いく画像をt2iで生成。
その後、Hires.fixを有効化してUpscaleという流れが良いです。

別に、UpscaleはHires.fixでなくとも構いません。
私はHires.fix以外のUpscaleを試したことがないので、ここでは
説明を省きます。


Batch size : 4 を 1に減らす

「GRAVITI Diffus」の改善してもらい点の一つです。
デフォルトでは[Batch size]が"4"に設定されているため、
「GRAVITI Diffus」のt2i画面を開いた初回に、真っ先に
設定を変えています。


[Generate]ボタン下の消費クレジットに注目

デフォルトでは[Width 512 x Height 512]サイズを[Batch size : 4] で
[Upscale by : 2] により from 512x512 to 1024x1024でt2i生成するため
20 creditsを消費します。

それではcredits消費を抑えるための実践編です。

まず、Batch size : 4 から 1 に減らします。

消費creditsが 20 から一気に 5に減りました。
これだけで消費 credits を4分の1まで削減できます。

次に[Upscale by : 2]から 1.5に減らし、
from 512x512 to 768 x 768 サイズに変更します。

これで消費creditsが 20 → 5 → 3まで減少しました。

最後に、[☑Hirefx.fix]を外します。
これで、なんと消費creditsを 1まで減少することができました。

上記の手順はあくまでそれぞれの設定で消費されるcreditsを節約
するために、わざと手間を掛けています。

そのため、普段使いとしては以下の二つの手順だけで十分です

  1. Hirefx.fixの☑チェックを外す

  2. Batch size : 4 を 1に減らす

ですが上記2つの手順を毎回、実施しなくてはcreditsの消費には
つながりません。

とはいえ、この手法を確立してからは、t2iの画像が768 x 768サイズで
1ヶ月で23,000枚生成することができました(日産700枚以上)

特にPrompts(Negative Prompts含む)や、Loraの設定値などをx/y/z plotで比較検証を行いたいときは必須の手順と言えます。

最後にt2iの画像サイズに触れます。

Width 768 x Height 768 サイズまででしたら 1 creditsで済みます。

では、1 creditsで済む画像の最大サイズはいくつでしょうか。

正方形でしたら 768 x 768 までです。
辺が2:3の比でしたら、624 x 936 までです(Width,Heightの入替可能)

624 x 936という2:3のサイズは見慣れないことでしょう。
ですが、理由があります。

「Stable Diffusion」の学習モデルは 8 pixelごとに画像を生成するためです。
そのため、キリのよい 640 x 960サイズですと、2 credits消費されてします。

とはいえ、 624 x 936のサイズは馴染み(なじみ)がないため、入力し辛い
のは事実です。

よって、t2iの画像生成サイズは以下の4点をおすすめします。

  1. 512 x 512(正方形)

  2. 768 x 768(正方形)

  3. 768 x 512(横長)

  4. 512 x 768(縦長)

私が多用する画像サイズは以下の2つです。
・768 x 768(正方形)
・768 x 512(横長)

特に、後者の768 x 512(横長)を多用します。
なぜなら、ほとんどのPCモニタは横長だからです。

ただし、「GRAVITI Diffus」を利用する際は、縦回転できるPCモニタの
使用を強く推奨します。
Web UIのパラメータが下に展開されるためです。

私が使用しているPCモニタは旧ナナオ(現:EIZO)のEV2460、
24インチのIPSモデルです。

縦回転および高さ調整が効くので、「GRAVITI Diffus」のWeb UIを快適に
利用することができます。

不満点を挙げるとすれば以下の2点です。

  1. 24インチモデルある。

  2. 解像度が1920 x 1080 のフルHDである

  3. USB PD機能が無い

iPadの画面の綺麗さを一度体験してしまうと、Windowsマシンのフォントの
汚さに幻滅します。
今からPCモニタを入手するのであれば、以下の点を考慮したほうがおすすめです(PC歴25年以上の経験有り)

<画像生成AIのPC環境にオススメなモニタ選定>

  1. 27インチ以上であること

  2. 解像度が4k以上、最低でもWQHD以上の解像度であること

  3. USB PD機能があること

  4. ピボット機能(画面回転) があること

  5. 高さ調節機能があること

  6. IPSまたはOLEDパネルであること

  7. 色域カバー率が高水準であること

上記の条件を満たす仕様のPCモニタを「価格.com」の
「PCモニター・液晶ディスプレイ スペック検索」で見繕うことをおすすめします。

画像生成にPCモニタの性能を重視すべき、という考えがあるのですが
意外にもPCモニタの仕様に言及している記事を見かけないため、執筆に
至りました。

以上です。