見出し画像

画像生成AI入門

ここ1カ月、時間を食われた画像生成AIだが、カジュアルに遊ぶだけであれば、Foocusを使用するのがベターと感じたので記事にする。Image Creator from Microsoft Bingよりは、もう少し幅を広げたいときにオススメである

前提

AIによる画像生成で遊ぶことが目的であり、個人で利用する範囲を想定している。なお、使用にあたり何か問題が起こっても責任は取れないのでよろしく

今回は以下の環境で実行することとする

  • Colaboratory(要、Googleアカウント)

  • Fooocus

Stable Diffusionであれば、Stability AI社のStable Studioがオフィシャルとなるが、環境構築が私も含めて初心者向けではないこと、また、PCの環境(GPU)に依存することを踏まえてGoogle Colabで実行できる環境が望ましいと判断した。また、Google Colab上での環境構築にはいくつかのコマンドを実行していくだけで遊ぶことが出来るので簡単である

構築

FooocusについてはオフィシャルのGithubを参照してほしい

Google Colabratoryでのセットアップ

FoocusよりGoogle Colabratoryで実行するコマンドが書かれている

!pip install pygit2==1.12.2
%cd /content
!git clone https://github.com/lllyasviel/Fooocus
%cd /content/Fooocus
!cp colab_fix.txt user_path_config.txt
!python entry_with_update.py --share

恐らく、上記でも実行できるとは思うが手を加えた、pipの行を追加した。Fooocusに必要なライブラリをインストールするものだ

!pip install pygit2==1.12.2
%cd /content
!git clone https://github.com/lllyasviel/Fooocus.git
%cd /content/Fooocus
!pip install -r requirements_versions.txt
!cp colab_fix.txt user_path_config.txt

また、毎回、"!python entry_with_update.py --share"を実行する度に、他の行を読ませることに意味を感じなかったので、Google Colabratoryにコードの行を追加で作成して実行するようにした。

なお、オフィシャルの説明にもあるように、最後の行を書き換えれば、アニメ風、リアル風と選べると書いてあるのでアニメを選択した。

In Colab, you can modify the last line to !python entry_with_update.py --preset anime --share or !python entry_with_update.py --preset realistic --share for Fooocus Anime/Realistic Edition.

https://github.com/lllyasviel/Fooocus
#!python entry_with_update.py --share
!python entry_with_update.py --preset anime --share

実行すると、GradioのURLが表示されるとアプリが立ち上がる

遊ぶ

後は適当にプロンプトに文字を入力して実行してくれればいいのだが、一点だけ注意点がある。オフィシャルの説明ではGoogle Colabの無料版ではリソースが限られているとあるが、これは具体的にいえばメモリ(RAM)のことを示すと思われる。実際にメモリ不足になったと見受けられる挙動に遭遇した。従って、refinerを無効にすることを忘れずにしよう。ここが一番、躓いたところなので強調しておく。他の記事を探しても、それらしい情報が見つからなかったので有用であると思う。皆、問題なく理解していたってことか?

Note that this Colab will disable refiner by default because Colab free's resource is relatively limited.

https://github.com/lllyasviel/Fooocus

無料の Colab のリソースは比較的限られているため、この Colab はデフォルトで絞り込み機能を無効にすることに注意してください。

Google 翻訳の結果

Refinerとは

FooocusではSDXLというモデルが採用されているが、BaseモデルとRefinerモデルでプロンプトからイメージを作成している、なお、Baseモデルだけでも描画可能とあるので無効にすればよい

次に、RefinerをFooocusの画面から無効にする

Refiner (SDXL or SD 1.5)をNoneとして無効にする

いくつかサンプルを作成してみる

アニメ調の描画も可能、スカイダイビングする犬
リアル風の湖畔の風景
よりリアルなCG風のロボット

まとめ

遊べば遊ぶほど、プロンプトと自分のイメージの乖離に対するジレンマに苦しむことになるので、時間が多々浪費されていくことだろう。もう少し、自動化や効率化などを別途、検討していく必要はあるのだが、時間を区切って遊べる人であれば、面白いかと思う。例えば、気に入った絵があれば、パソコンの壁紙にしてもいいだろう。前述の通り、商用利用するときには非常に神経を使うことになるのでここでは割愛する。新たな消費とした方がよいかとは思う。なお、ChatGPTと同じように研究が進んでくれば、より生産的に使用することも可能となってくるだろう。

おわり!

この記事が参加している募集