見出し画像

StableDiffusionのちょっとしたメモ(ローカル環境)

basujindal版にGUI付いてるじゃん

本家版を試してたんだけど、Python知識が無くてimg2img.pyを半精度に修正するのが上手くいかなかった。仕方ないのでbasujindal版(速度が犠牲になる代わりにVRAMの使用量が抑えられるフォーク)を調べてたら、簡単なGUIも同梱されていることに気づいた。

Readmeを参考に、仮想環境下にGradioをインストールしておく。
optimizedSD/img2img_gradio.pyを実行するとローカルURLが提示され、ブラウザからアクセスすると操作ページが現れる。

promptを練った訳じゃないので雰囲気だけ

入力画像がD&Dで指定できたりパラメータをスライダーで調節できて便利。
注意点として、どうも画像の出力が終わったりブラウザを閉じたりするだけではメモリが開放されない。起動に使ったプロンプトから終了させる必要があるみたいだけど、ctrl+cで良いのか…?

本家版で環境構築している場合

わざわざbasujindal版を入れ直すのもなぁ、と思っていたがReadmeを読むとoptimizedSDフォルダが変更の全てだから本家版をクローンしてるならそこだけDLしてきてぶちこめばいいと書いてあった。
逆に言えば、basujindal版を導入していても、scriptsフォルダ内のスクリプトを実行すれば本家版の挙動を手軽にチェックできるということか。後々本家版の省メモリ化が進んできたら役に立つ…?

basujindal版と本家版

ちなみに、optimizedSDのtxt2imgやimg2imgはメイン処理の他に

  • デフォルトのシード値をランダム化

  • グリッド画像の生成は省略

  • 画像の保存先が入力したprompt名のフォルダ

等、細かい部分にも修正が加えられていてなんとなく気が利いた感じになっている模様。また、どういう違いがあるのか知らないが--plmsオプションが使用不可になっていたりする。

なお、VRAMに余裕がある場合には--turboオプションを指定することで1GBほど余分に使用する代わりに速度が少し改善されるらしい。


この記事が気に入ったらサポートをしてみませんか?