見出し画像

Stable Difussionはじめました

画像生成AIが普及してかなり今更感ありますが、Stable Difussionを使ってみました。

元々、前々から一度は使ってみようと思っていたのですが、一時期論争になった著作権侵害の話などの行く末が気になったので少し様子見して、だいたいの方向性が見えてきたので、まあ個人で使う分には大丈夫そうね、という判断です。収益化しようとか、グラビア作っている人ほどの熱量はないので、PhotoShopを30年前に勉強したときと同じような初心に返った気持ちで純粋に”慣れる”目的です。

呪文よりモデルやLoRAがほとんど重要と分かった

使ってすぐに分かりましたが、Stable Difussion自体は「ランダマイザーの箱」でしかありません。これが芸術的なものを一発で仕上げる確率は天文学的確率です。はっきりいって絶望的です。

Stable Difussionをまとも(可愛いキャラクター作りたいといった目的を達成するには)、はじめにモデルデータといって学習済データを活用することがキモです。これを作れる人が一番すごくえらい。それが無料で公開されているので、それを手に入れるストレージ容量の余裕があるかどうか、そして、実際にそういうモデルデータを見つけられるかどうかで、ほぼほぼ結末が決まります。

生成呪文はそれっぽい言葉を並べたとて、モデルデータ次第で全然結果が変わってきます。呪文も凝った絵柄には重要になってきますが、私の場合は99%モデルデータだなあこれ、と思いました。

生成したあとに直すテクニックがあるらしい

生成したら、はいおしまい、ではなく、生成後のデータに追加指示で補正を加えたり生成段階であらかじめギミックを要求するテクニックもあるようです。そうした塊をLoRAたVEAなどというようですが、初日なので理屈っぽいことは抜きでとりあえず、色々作って遊んでみました。

個人的にはGoogle画像検索の上位版みたいな資料生成装置みたいな位置付けで使えないかなーと考えています。ランダム生成される絵に自己実現のような感覚が分かないので、連日せっせとAI絵をアップするようなAI絵師にはならないと思いますが、趣味の範囲内で思ったものがそれなりに作れるようにはなれるといいなと思います。とはいえ、ランダムなのでこれが滅茶苦茶むずかしいのですが。

参考にしたサイト

今回2つのサイトを参考にしました。情報の精度は高く、これを無料で公開されるとは寛大だなあと感謝の気持ちと、実際に参考になったという意味も込めて紹介します。

Pythonのバージョンなどは厳密に注意しよう

今回試して分かったのですが、Stable Difussionを使うには、それなりのネット速度とPythonやGitインストールできる程度の知識は必要です。何より、バージョン指定が厳格でLTSならどれでもいいじゃろうみたいな考えだとWebUIが起動しないなどのトラブルがあるようなので(私より先にStable Difussionやってた友人はそこを軽視していたようで、WebUIに失敗していた)、Pythonのバージョンなどは厳密に注意しましょう。私は下記の環境で動作に成功しています。WebUI version: v1.10.1  •  python: 3.10.6  •  torch: 2.1.2+cu121  

GPUはNVIDEA RTX A2000 12GBを使っています。今回生成した1024x1024の画像1枚あたり30秒~40秒ぐらい待てばできる感じで全然許容範囲です。もっとヘビーなのかなと恐る恐るインストールしていたので拍子抜けでした。

ネットできちんと環境構築で出ていない情報として、C++ビルド環境を入れておかないと`pip install -r requirements.txt`が通りません。VisulalStudio無料版をインストールして、C++デスクトップ環境を入れておけば通るのでハマった人は参考にしてみてください。

python: 3.10.6以外でうまくいくかとか、凝ったことは一切検証していません。
そこまで時間かけたくない。

イラストができるのはわかった、これからどうするか?=特に決めてない。

ひとまず、あまりガッツかずにボチボチで楽しもうと思います。
というのも、AI絵師さんの中には、自己実現や自己達成がイラストを作ることなのか呪文を極めることなのか、そもそも、いいね!沢山もらうことなのか、何が目的で何が手段か、かつては過程や手段に過ぎなかった物事までものが目的と化している承認欲求お化けみたいな人をたくさん見かけており、何というか、そこまで悲痛な思いをしてAI生成に没頭したくないなあが本音です。投資が手段ではなく目的と化して先物取引やFXや信用取引で多重債務になる人みたいなオチ、あんまり好きじゃないんですよね。

ほどよい距離感の新しいツール、無料で使えるクリエイティブなパートナーとしてStable Difussionが使えていけたらいいなと思います。

それぐらいゆるーーーいユーザーとして使っていければな、と考えています。
それではまたごきげんよう。


この記事が参加している募集

いただいたサポートは活動費に使わせていただきます