画像生成AI入門
ここ1カ月、時間を食われた画像生成AIだが、カジュアルに遊ぶだけであれば、Foocusを使用するのがベターと感じたので記事にする。Image Creator from Microsoft Bingよりは、もう少し幅を広げたいときにオススメである
前提
AIによる画像生成で遊ぶことが目的であり、個人で利用する範囲を想定している。なお、使用にあたり何か問題が起こっても責任は取れないのでよろしく
今回は以下の環境で実行することとする
Colaboratory(要、Googleアカウント)
Fooocus
Stable Diffusionであれば、Stability AI社のStable Studioがオフィシャルとなるが、環境構築が私も含めて初心者向けではないこと、また、PCの環境(GPU)に依存することを踏まえてGoogle Colabで実行できる環境が望ましいと判断した。また、Google Colab上での環境構築にはいくつかのコマンドを実行していくだけで遊ぶことが出来るので簡単である
構築
FooocusについてはオフィシャルのGithubを参照してほしい
Google Colabratoryでのセットアップ
FoocusよりGoogle Colabratoryで実行するコマンドが書かれている
!pip install pygit2==1.12.2
%cd /content
!git clone https://github.com/lllyasviel/Fooocus
%cd /content/Fooocus
!cp colab_fix.txt user_path_config.txt
!python entry_with_update.py --share
恐らく、上記でも実行できるとは思うが手を加えた、pipの行を追加した。Fooocusに必要なライブラリをインストールするものだ
!pip install pygit2==1.12.2
%cd /content
!git clone https://github.com/lllyasviel/Fooocus.git
%cd /content/Fooocus
!pip install -r requirements_versions.txt
!cp colab_fix.txt user_path_config.txt
また、毎回、"!python entry_with_update.py --share"を実行する度に、他の行を読ませることに意味を感じなかったので、Google Colabratoryにコードの行を追加で作成して実行するようにした。
なお、オフィシャルの説明にもあるように、最後の行を書き換えれば、アニメ風、リアル風と選べると書いてあるのでアニメを選択した。
#!python entry_with_update.py --share
!python entry_with_update.py --preset anime --share
実行すると、GradioのURLが表示されるとアプリが立ち上がる
遊ぶ
後は適当にプロンプトに文字を入力して実行してくれればいいのだが、一点だけ注意点がある。オフィシャルの説明ではGoogle Colabの無料版ではリソースが限られているとあるが、これは具体的にいえばメモリ(RAM)のことを示すと思われる。実際にメモリ不足になったと見受けられる挙動に遭遇した。従って、refinerを無効にすることを忘れずにしよう。ここが一番、躓いたところなので強調しておく。他の記事を探しても、それらしい情報が見つからなかったので有用であると思う。皆、問題なく理解していたってことか?
Refinerとは
FooocusではSDXLというモデルが採用されているが、BaseモデルとRefinerモデルでプロンプトからイメージを作成している、なお、Baseモデルだけでも描画可能とあるので無効にすればよい
次に、RefinerをFooocusの画面から無効にする
いくつかサンプルを作成してみる
まとめ
遊べば遊ぶほど、プロンプトと自分のイメージの乖離に対するジレンマに苦しむことになるので、時間が多々浪費されていくことだろう。もう少し、自動化や効率化などを別途、検討していく必要はあるのだが、時間を区切って遊べる人であれば、面白いかと思う。例えば、気に入った絵があれば、パソコンの壁紙にしてもいいだろう。前述の通り、商用利用するときには非常に神経を使うことになるのでここでは割愛する。新たな消費とした方がよいかとは思う。なお、ChatGPTと同じように研究が進んでくれば、より生産的に使用することも可能となってくるだろう。
おわり!