『StableDiffusionWebUI』を導入して触ってみた記録
AIの進化が早すぎる。
「手が描けない」だの「嘘しか言わない」だの、そんなことを言っていた頃が懐かしい。
いや懐かしいとか言ってるが、下手したら数ヶ月前のことでしかない。
そして、もはやAI活用で「やっぱAIとか使えね〜w」なんて笑っていられる状況は過ぎ去ったように思う。
そんな発言をしたら、「それあなたの使い方が悪いだけですよね?」みたいに真顔で返されるのが現在のAI界隈な気がする。
AIは指示の仕方で全く別次元の仕事をする。
人間だって、人を上手に使える上司というのは、指示がしっかりしているものなのだ。
AIを生かすも殺すも使う人次第。
(まあこれもそのうち解決されていきそうな気がするけど)
というわけで今回は、『StableDiffusion WebUI』を導入したあれこれを話そうと思う。
「何それ?」と思っている人もいるかもしれない。
自分もかなりイラストAIから離れていたので、最初は意味不明だった。
まず、皆さんご存知のイラストAIサービスであるMidjourneyやBingなどのイラスト生成では、トークンというものを消費して出力を行っている。
そしてトークンがなくなったらお金を払って購入したり、それが嫌なら再度トークンが補充されるまで、時間経過を待つ必要があった。
だがそんなトークン消費の概念を一切必要とせず、出力し放題でカスタムもできちゃうのが、StableDiffusion WebUIである。(すごい)
これはまず自分のPCにAIイラスト生成のローカル環境を構築するところから始まるのだが……
……まあ、うん。
もうnoteで導入方法を書いてる人がいっぱいいるので、それ読んでやってもらって……
そしてこれに追加して、Youtubeで導入法解説の動画を5つくらい見ると更に良い。
5つも見れば、なにかと躓いた箇所が解決したり、新たな知見が得られたりするし、他の動画も見たいと思える解説者にも出会えるだろう。
こんな情報が無料で手に入るとか、本当に良い時代だ。
……で、現在自分はローカル環境を構築し終わり、出力しまくりである。
1週間ほど弄り倒したが、フォルダの画像は10000枚を余裕で越えた。
これをトークン消費前提のAIイラストサイトで生成していたら、お金がいくらかかるやらだ。
例えばMidjourneyは無制限モードがあるものの、月額なんと60ドル。
日本円にすると2023年5月21日のレートでは8300円だ。
もはやAdobeCCより余裕で高い。(昔紹介したときは30ドルだったのに…)
しかし自分も1万枚生成したとはいえ、これらの大半は使い物にならない画像ではある。
だが稀にキラリと光るものもあったりするのだ。
これが最高にガチャっぽい要素であり、「あと一回…!あと一回…!!」と睡眠時間を減らすことになる。(かかるのが電気代だけなのでまだ良いが)
※StableDiffusion WebUI生成例↓
ちなみに「AIは手が描けない」というのは、ぶっちゃけまだ解決してないように思う。
普通に手も腕も増えるし。
しかしこういう破綻に関しては、自分が素のままのStableDiffusionWebUIをなんとなく使ってるだけだからというのもあるだろう。
ControlNetやRoLAなど、追加で使うとなんだかもう大変なことになっちゃう要素が続々と出現しているのが今のイラストAI界隈だ。
それらを使えばどうにかなるのかもしれないし、最先端を行く人たちはもう自分のような凡人とは見えてる世界が違うのかもしれない。
そして何より、自分で破綻箇所を修正する能力があるプロのイラストレーターにとっては、AIは相当利用価値が高いように素人目には見える。
イラストAIに対するプロイラストレーターの意見も賛否あったと思うが、優秀なクリエイターが使いこなしたら大変なことになるのは確実だろう。
そして個人的に懸念だった英語に関しては、ネット検索やDeepL、ChatGPTがあるので、わりと問題なかった。
特にChatGPTはめちゃくちゃ優秀なアシスタントになる。
例えばイラスト生成で衣装に悩んだときに、「衣装の名前を50個挙げて」みたいな質問をすれば、即座にそれを提示してくれるのだ。
他にも聞きたいことには大抵回答をくれるし、いつでも使える。
探究心に溢れて吸収力もある子供が、今後GPT-5とかになったChat系AIを使い始めたら、1年くらいで義務教育を越えるレベルの知識とかついてそうだ。
そしてきっと発想の引き出しの多さもエグいことになるのだろう。
「AI任せで何も考えられなくなる!」なんて話をたまに聞くが、自由な発想には蓄積した大量の知識が必須だと自分は思う。
AIを使った子供と使わなかった子供、両者は一体どれだけ差がつくのだろうか……?
ちなみに自分は今のところGPT-4にするための課金はしていないが、「月額20ドルで超優秀なアシスタントを雇える」と考えると、なんだかすごくお得な気がしてきた。
なにせ20ドルなんて、人間で考えたら4時間すら雇えない金額だ。
優秀で24時間勤務の人材を1ヶ月20ドルとか、もう破格どころではない。
なんというか、全てのAI技術がここへ来てあらゆるものと噛み合って、相乗効果で進化が加速している気がする。
乗るしかない、このビッグウェーブに!
しかし山ほど画像を生成可能なStableDiffusionWebUIにも問題はある。
ローカル環境を作るためには、それなりのPC性能が必要なのだ。
中でもStableDiffusionWebUIにおいては、GPUメモリの大きさがかなり重要になってくる。
ちょっと前まではGoogle Colabというものを利用して、「自分のPCのスペックが低くてもGoogle社のGPUを使うので問題ない」という最強の手が使えたのだが、みんなが盛大に使ったのでGoogleが白旗を上げ、今はお金がかかるようになってしまった。(無料というのがそもそも太っ腹すぎたのだが)
なので自前で良いグラフィックボードを用意しなければならない。
さて、そんな自分のPCは、スターオーシャン6をプレイするために買ったゲーミングデスクトップPC。
搭載しているGPUは『RTX 3060Ti』で、GPUメモリは8GB。
しかし正直なところ、AIイラスト生成ならGPUメモリは12GBは欲しい。
実はRTX ”3060”という3060Tiよりも少し性能が劣るGPUがあるのだが、なぜかGPUメモリだけは12GB積んでおり、AIイラスト生成には3060の方が良かったりする。
自分は「ゲームをするなら性能の高い3060Tiのほうがいいな!」と思って購入したわけだが、ゲームをろくにしなくなった今となっては「3060にしておけば…」と後悔している。
人生、こういうこともあるのだ……
そして実際使ってみて、GPUメモリ8GBでは確かにきつい。
ある程度の解像度の画像生成までは可能だが、高画質化の際にはほぼ確実にGPUメモリが不足するので、イラスト生成の本当の奥深さを知ることはできない気がする。
なので今からPCを組む人は、イラストAIをやりたいのであればしっかりと調べて買うことをおすすめしたい。
ものによってはGPUメモリが24GBなんてものもあるし。
……え? 値段?
そりゃあもう、すごいですよ。
長いブランクがあったが、イラストAIはやっぱり面白い。
最先端の人たちには追いつける気がしないが、これはもう本気で凄い技術だというのを自分でもひしひしと感じる。
しかも「絵柄の固定」、「ポーズ指定」、「部分修正」、「自分用に追加学習させたモデル作成」などなど、まだ自分が触れていない沼要素が目白押しなのだ。こりゃまだまだ掘れる。
イラストだけでなく、最近は動画や音声にもかなり本格的にAI利用の動きが出てきたし、1年後には世界はどうなっているんだろうか。
一人のクリエイターがAIと組んで、自作映画とか1年で作っちゃうのも数年以内のことかもしれないな……。
そんなわけで、良い感じのGPUをお持ちでイラストAIに興味のある方は、是非ともStableDiffusionWebUIに触れてみて欲しい。
ハマる人は本当にハマれる深い魅力を持っている技術だ。
まあこのタイミングでの電気代アップが本当に勘弁して欲しいところではあるが……
……この夏、乗り切れるのだろうか?
この記事が参加している募集
サポートには感謝のコメントをお返しします!