見出し画像

【AIイラスト】AUTOMATIC1111の環境構築をしてみた【StableDiffusion】

前回の記事でいろいろAIイラストのツールだったりサービスについて調べてみました。早速AUTOMATIC1111の環境構築をしていきたいと思います。
前回の記事はこちらから

いざ構築!

構築方法を少し調べる

構築方法としてよく紹介されているのはColab(Colaboratory)ですかね。GPU付きの仮想環境を無料で使えるのは確かに便利そうですが、環境が無料でリセットされてしまうのはちょっと不便です。なので、ローカルPCに環境構築をすることにします。
自分のPCのスペックは以下になります。
CPU:AMD Ryzen 9 5950X
GPU:RTX 3060Ti 8GB
メモリ:64GB
なので要求スペック的には行けそうです。

Dockerでも環境構築できそう?

といっても利用者数的に不安なので、公式の手順に従っていこなっていきましょう。

https://github.com/AUTOMATIC1111/stable-diffusion-webui
素直に公式に従うのが一番です。(こういった環境構築に慣れていない人向けコメント:一応記事っぽくするために行った手順を画面ショット付きで書いていきますが、絶対行うタイミングでの公式の最新の手順通りにやったほうがいいです。)

Automatic Installation on Windows

  1. Install Python 3.10.6, checking "Add Python to PATH"

  2. Install git.

  3. Download the stable-diffusion-webui repository, for example by running git clone https://github.com/AUTOMATIC1111/stable-diffusion-webui.git.

  4. Place model.ckpt in the models directory (see dependencies for where to get it).

  5. (Optional) Place GFPGANv1.4.pth in the base directory, alongside webui.py (see dependencies for where to get it).

  6. Run webui-user.bat from Windows Explorer as normal, non-administrator, user.

構築

1.Install Python 3.10.6, checking "Add Python to PATH"

指示通りPython 3.10.6を入れます。自分の場合もともと入っているものがあったので更新。

インストーラーもあって便利ですね。問題なく更新完了。

一応確認

2.Install git.
3.Download the stable-diffusion-webui repository, for example by running git clone https://github.com/AUTOMATIC1111/stable-diffusion-webui.git.

gitはインストール済みなのでそのままcloneします。

4.Place model.ckpt in the models directory (see dependencies for where to get it).


モデルを取得します。一旦どんなモデルがあるのかを調べてみます。

いろいろあって面白そうですが、自分はアニメっぽい画像を作ってみたいので、とりあえず以下を使ってみます。

ダウンロードしたら先ほどcloneしたファイル\stable-diffusion-webui\models\Stable-diffusionに
Put Stable Diffusion checkpoints here.txt
とあるので言われたとおりに配置します。

5.(Optional) Place GFPGANv1.4.pth in the base directory, alongside webui.py (see dependencies for where to get it).

これはオプションとのことなので無視します。

6.Run webui-user.bat from Windows Explorer as normal, non-administrator, user.

バッチファイルをそのまま実行します。環境構築系はこういったときにうまくいくか毎回ドキドキしますよね。

少し(結構?)時間がかかるようなので、そのまま放置します。普段コマンドプロンプトとか触らない方は「プログラマーっぽい!!」ってテンションが上がるかもしれませんね?

(余談)全く関係ないですが、今回の環境構築関連でよく目にするColaboratoryがChocolateyに見間違えてしまうことが多い問題。あ、chocolateyで環境構築できるんだ…?あれ?何か様子がおかしい?となることが。Colaboratoryを今まで存在自体しりませんでした。便利なものがあるんですね。

無事起動しました。自分の環境では初回起動まで10分くらいですかね?

ちゃんと起動できていますね。

A girl thinking in front of a computer,illustration,kawaii,glasses.で生成。

これがボタン押して3秒くらいで作れてしまうというのは驚きですね。いやーすごい。

試行錯誤してみる

ちょっとせっかくなので、自分が描いたイラストをこのAUTOMATIC1111で製作できるのか、試行錯誤してみたいと思います。

適当なprompt(?)を作成して実行

単純に文章を英語にして入力してみます。

A girl in school uniform is in the water. She is holding a bottle of mail in her hand. Clear sky with a few clouds.kawaii,illustration

とりあえず12枚ほど出力してみました。選りすぐりせずに順にすべて保存です。こんな雑promptでも結構それっぽくない?って正直驚き。

絵からpromptを作成して実行

ちょっとpromptの作成補助もしてもらいましょう。イラストからpromptを作成してくれるものを見つけたので使ってみます。

a woman sitting in the water with a bottle in her hand, an anime drawing by Un'ichi Hiratsuka, pixiv contest winner, rayonism, pixiv, windows vista, flat shading

こんな感じになりました。pixivって入れるといいのか…?平塚運一さん(1997年にお亡くなりになった版画家さんとのこと)?むむむ?とはなりつつも、いったんこれを入れてまた画像を生成してみます。

こんな感じ。うーん、個人的にはさっきのほうが近くない?という印象。

絵とpromptを組みあわせて実行

こんな感じに、先ほどの平塚運一さんが含まれるプロンプトと組み合わせて12回実行。

右下のはなんかちょっとした現代アートっぽい気もしますが、少なくとも色合いとかポーズとか雰囲気は一気に近づく印象。ポーズ指定には間違えなく使えそう。

では、初めに作ったpromptと組み合わせたらどうなるのか試してみました。

時々不思議なアングルのイラストが生成されますが、左上とか右下の絵とかポーズ結構そのままですよね。左下の絵はシルエット結構好き。

楽しい。

英語からpromptにして実行

どうやら調べているとpromptは英語ではなく、入力順も大切みたいです。

英語をインプットすると複数パターンpromptを作成してくれるサービスを見つけたので、さっそく使ってみます。

8kとか4kとかはフレーバーテキストでいったんつけておくみたいな感じなんですかね?

A girl in school uniform is in the water. She is holding a bottle of mail in her hand. Clear sky with a few light, by Jesper Ejsing, by RHADS, Makoto Shinkai, RPG Illustration, award winning, Artstation, CGSociety, rule of thirds, volumetric lighting, 8k resolution

一気に絵が華やかに…!新海誠パワー…!?ライティングとかは「Makoto Shinkai」とかつけるとそれっぽくなるのかも。

A girl in school uniform is in the water. She is holding a bottle of mail in her hand. Clear sky with a few by artgerm,Tom Bagshaw,Lawrence Alma-Tadema,greg rutkowski,alphonse Mucha,deviantart,FAN ART,Unreal Engine,face enhance,8K,golden ratio,cinematic lighting H 704

一番下のも試してみました。結構変わるんですね。そりゃ指定している内容が異なるので当たり前ですが。

もう一度promptと絵を組み合わせてみる

A girl in school uniform is in the water. She is holding a bottle of mail in her hand. Clear sky with a few light, by Jesper Ejsing, by RHADS, Makoto Shinkai, RPG Illustration, award winning, Artstation, CGSociety, rule of thirds, volumetric lighting, 8k resolution

この「Makoto Shinkai」パワーを加えてimg2imgで生成するとどうなるのか試してみます。

結構いい感じ。

結論

シンプルに楽しい。
環境構築も簡単でしたし、今回のような512*512ピクセルであれば5秒程度で何度も作り直せてしまいます。全部初期設定で文字通りテキトーな文字を入力してあげるだけで、少なくともサムネイルサイズであればきれいなイラストができました。すっげぇ。

多分いろいろと呪文を覚えていったり、モデルデータを切り替えながら利用すれば結構いい感じにできそうですね。

グラボがずっとうなり続けてますが、これから寒くもなりますしきっとちょうどいいと思います。もう少し楽しみます。

いろいろ調べてちょっと試行錯誤してつくったやつ。きれいだねー。


この記事が気に入ったらサポートをしてみませんか?