AIによる画像生成で遊んだとりあえずの感想

Twitterのタイムラインで連日話題となっていた画像生成AIで一週間ほど遊んでみた話です。
発作的に「よしやるか!」となって始めました。
これから偉そうなことを語ることもありますが大体後付けです。

まぁー木っ端絵描きとして思うアレもあったのですが、だからこそ触れておこうというソレもありました。
基本的に世のいざこざの原因の一つは相互の不理解とそれを諦める思考の放棄だと思っています。
対話しましょう。AIと。

環境構築

最初に使用したツールはCUI上で動く「Stable Diffusion」とそのAIモデル。
もともと「話題のAIがナイスなGUI上で動く!」というネット記事に釣られて「Stable Diffusion WebUI」を導入してみたのですが、自分の環境だとGPUの相性が悪いのか緑一色の画像が生成されるだけでした。
で、色々調べた結果、コマンドラインでの生成だと引数「--precision full」を追加して実行することでちゃんとした画像ができるようになりました。
もっとスマートに解決できるようになりたいです。

自分の環境だと生成は一度に5枚。約5分で出てきます。
高性能高負荷な生成方法だとメモリ不足で処理が停止しました。64GBとかのメモリってこういう用途に使うんだなって納得。

Stable Diffusionで画像生成

とにかくkawaii girlが見て~という欲望の元、連日PCに負荷をかけまくりつつ、AIへの注文となるいわゆる「呪文」のコツとかをネットで漁りました。この辺発展途上の分野を研究する魔法使いにでもなった気分で楽しかったです。

生成された画像は、まあ、大半がまともな評価を下せるものにはなりませんが、たまに目を見張るような名画が出てきます。
「無料で回せる5連ガチャ」と掲示板で言われていましたが、確かに射幸心を煽られるような側面もありますね。

以下お気に入りの成果物。

初日に初心者向けサイトの呪文そのままで生成されたビギナーズラックの権化。
最近のアニメ映画のワンカットだよと言われても騙されかねない。
"a illustration of the kawaii girl wear white dress with white hair on the moon under starry sky in the style of picture book, the little prince, anime"
一番のお気に入り。すごいセンスを感じる。
絵本っぽさの補強のために呪文にthe little prince(星の王子様)を入れたのが効いたかも。
女の子のツンツンヘアーもその影響か。

Waifu Diffusion現る

ある夜、界隈へ衝撃が走りました。
海外の(ちょっとアレな)画像サイトのデータをAIへ学習させ、よりkawaii画像が生成されやすくなった「waifu diffusion」が登場したのです。
二次元イラストに関しては「Stable Diffusion」より遥かに高精度!

”cute_girl,feathered_wings,collared_cape,anime,mountains,blue_sky”
本当に注文通りに出てきてビビる。
この辺からAIへの敗北感をひしひしと感じます
”cute_girl,musket,animal_ears,black_coat,full_body,anime”
猫耳の精度が高いのもWaifu Diffusionのいいところです。
画像は見切れちゃっているけど…。
ちゃんと服装を指定しないとやたら肌色が多いものが出てきたりもします。

とりあえずの感想

さて本題です。
まず、世間をにぎわせる最近の技術に自身の手で触れられて楽しかったです。「Waifu Diffusion」もそうですが、今ネットを見渡せばいたるところで呪文や新機能、AIの活用法、あるいはその是非について論じられており、その流れに一時身を浸すだけでもいい経験でした。
どれも未知の領域だったり正解が見つかりにくいものだったりなので、ゲームの発売日の情報共有とはまた違ったわくわくを感じますね。

で、思ったのと違ったことについてです。
「AIが画像を生成してくれても自分が描いたわけじゃないし、自身が主体じゃない作品に愛着なんて湧くわけないんだぜ☆」とか思ってた私ですが、なんだかんだ環境構築から試行錯誤して生成までやって、やっと納得がいく出来の画像が生成されると結構気に入って人に見せちゃうしスマホの壁紙にもしちゃうのでした。
手間がかかればと手段はともかく当人の中では良いものになるようです。この辺、さらにAIが高性能になってイメージ通りのものがポンと出てくるようになるとどうなるか、気になるところです。

タイトルにも「とりあえず」とついているのは、AIをめぐる界隈はどんどこ変化していって自分の考えも変わっていくだろうなあと考えたからです。
人生のどの時点でも「思うように絵が描けないなあ」と思ってきた今の私としては、AIが誰でも自分のイメージを具現化できる助けになるならその方がみんな楽しいだろうと楽観的に思っています。
それで言うと、何回も試行しては時折の見栄え良い成果物を喜ぶ、現時点のAIと私の使い方だと理想には程遠いわけですが。
人間と機械、どちらもいい感じにアップデートされていくといいですね。

この記事が気に入ったらサポートをしてみませんか?