見出し画像

Stability Matrixで始めるStable Diffusion WebUI環境

画像生成AIはAI Pictorsから始まってGRAVITI Diffusを経由して、自作PCを組み立ててローカル環境を構築するに至りました。

AIピクターズ | AIイラスト・小説投稿サイト (aipictors.com)

GRAVITI Diffus - Stable Diffusion WebUI

自作PC環境
CPU:AMD Ryzen 5600
マザーボード:ASRock B550PRO4
メモリ:DDR-3200 16GBx2
M.2 SSD:1TB
グラフィックボード:MSI GeForce RTX 2080 Ti 11GB
電源:750W
電源ケース:Antec

上記の環境かつ、VAEとCheckpointをメモリのキャッシュに乗せる設定で1生成あたり(512x512ピクセル)2.4秒ほどです。

1枚あたり2.4秒

2080Tiは中古で4万円を切る価格ながら、4060Tiと同程度の能力を持っているため、コスパが良いです。
中古品に抵抗感が無ければおすすめします。
なお、hires使用時はそれなりに時間が掛かります。

上記画像をhires x2 1024x1024ピクセルにアップスケールして10.9秒

Stability Matrixの導入はこちらのページを参考にしました。

Stability MatrixでインストールできるStable Diffusion WebUIは7/13現在、Version 1.9.4 です。
Stable Diffusion WebUI以外にもFooocusやComfy UIがインストールできます。
Forge版は私の環境ではエラーが出てしまい起動できませんでした。

学習環境はOneTrainerとkohya ss GUIの2つがあります。
kohya ss GUIは正常に動作しなかったため、OneTrainerを使用して自作Loraを作成しています。
有料記事はこちら。

Stability Matrixから利用できるLoRA学習環境OneTrainerの使い方|お茶濁す (note.com)

WebUIでつまづいた点は--skip-torch-cuda-testのエラーが出ることでした。
回避策として、WebUIフォルダ内のwebui-user.batのset COMMANDLINE_ARGS=に--skip-torch-cuda-testを追記して再起動してあげると起動しました。

なお、ControlNetが実装されていません。
Stability Matrix環境でもControl Netを実装できるかは不明です。
私はGRAVITI Diffusを月額US$1で維持して、Control Netを使用しています。

使い勝手が良いのはComfy UIです。
ですが、WebUIとLoraの生成結果が異なるため、専らWebUIを使用しています。
Loraを使用しないなら、Comfy UIをおすすめします。