新しい画像AI『StableDiffusion』でアーマードコアっぽい画像生成

2022年8月14日 21:58

こんにちは。近頃イラスト界隈ではMidjourneyが注目を集めていますが、画像生成AIの分野ではMidjourney以外のAI開発も盛んに行われています。私が最近β参加している『StableDiffusion』は、運営が管理するサービスを通じて提供される形体が多い画像AIの中でも、「オープンソースで誰でも自由に使えるAI」を目指してStability AIが開発しているものです。オープンソースの言語AIであるGPT-J-6BやGPT-NeoXなどで知られるEleutherAIも開発に協力しており、このStableDiffusionは既にgithubでソースが公開されています。学習済みモデルの研究者向け提供も始まっていて、個人向けの公開も順次行われる模様です。画像AIの動作には強力なGPUが必要になるものですが、技術進歩により小規模モデルでも高度な画像が出力できるようになってきており、StableDiffusionはなんとVRAM容量10GB以上の個人用GPUで動作すると言うので驚きです。

~~βへの参加申請はこちら~~。（2022/08/20 web版がサービス開始したのでβは終了しました。）

StableDiffusionはオープンソースですので、今後様々なwebサービスを通じてこの画像AIを触る機会があるかと思います。海外のAI小説サービスのNovelAIも挿絵生成の為に取り入れる予定のようで、デモンストレーションを公開しています。

前置きが長くなりましたが、今回はStableDiffusion（以下：SD）にアーマードコアっぽい画像を出力させてみましたので、その試行錯誤の過程をご覧ください。本当は「ツイッターでよく見るMidjourneyでアーマードコアっぽい画像生成してる人みたいなのがやってみてぇ～」と思ったんだけど、Midjourneyの課金が切れていたのだ。

取りあえず「armored core 4」だけ入力して出て来た画像。ロボですね。SDのβでは基本サイズである512*512の画像が１枚５秒程度で生成されます。もちろん任意にサイズ変更したり、一度に最大９枚までの画像生成が可能です。スケールアップ機能は無いので、そちらは別で行うしかないけど。

armored core 4, unrealengine, blue sky, dynamic lighting

「AI画像のクオリティ上げたきゃUnrealEngineって書き加えろ」と言われる"UnrealEngine"を加えて生成。3DっぽくなってAC4感が出て来ましたね。でも今回は3DっぽいACじゃなくてイラストっぽくしたいのだ。

armored core 4 by liam wong, dramatic lighting, cinematic establishing shot, extremely high detail, photorealistic, cinematic lighting, unrealengine

armored core 4, fantasy, circuitry, explosion, dramatic intricate, artstation, concept art, smooth, sharp focus, illustration by john carp

armored core 4 by liam wong long shot, full body, sky, cloud, dramatic lighting, cinematic, establishing shot, extremely high detail, photoreal

サイズを変更してトライ。SDのAIは512*512をベースに思考しているので、あまり横長にし過ぎると要素の重複が起こるので注意。（"一人の"と指定した人物が二人出てきたり、構図内のパースの消失点が二つになったり）

うーん、結構良い感じなってきたけど、まだちょっと思ってるんと違うのだ。幸いSDのβは””完全無料””なのでリトライはいくらでもできます。ありがてぇーっ！！

80mm resin detailed miniature of a armored core with red, rifle, full body, head, legs, textured base ; product photos, 4 k, view from front

一時間ほど試行錯誤して疲れてきたので脱線…。ネットで拾ってきた画像じゃなくてSDで生成した画像ですよぉーっ！御覧の通りSDは実写性能が高く、人体バランスを結構保ってくれます。ただMidjourneyっぽい色の濃い水彩っぽい雰囲気がありつつ線がパキッとしてる感じのを再現したかったですが、ちょっと難しいですね。何て入力すれば良いのか分からぬ。AIにMidjourneyの画像を学習させればMidjourney以外のAIも「Midjourneyっぽく」でMidjourney再現できるようになるんちゃう？

そんな訳でトライを繰り返して最終的に良い感じになったのがこちら！！

an armored core v by liam wong, booster flares, legs, laser rifles, karst landscape, outdoor, dark blue sky, cloud, wilderness ground, golden time, twilight ; wide shot, digital painting, photoreal, cinematic contrast, dynamic backlighting, sharp edge, motion blur

an armored core on the ground, booster flares, legs, crossfire, laser, karst landscape, clouds, daylight ; detailed illustrations, pastel tones, deep colors, clear lines, motion blur, by jordan grimme, greg rutkowski

あ～、いいっすねぇ！生憎SDは「アーマードコア＝なんかロボっぽいやつっしょ？」くらいの認識なようで、どちらかというとバトルテックっぽいロボになってしまいがちなようです。でもACだってタンク脚とか四本脚とか武器腕とかある訳だし、23系と4系とV系は違うし、そもそもACっぽいロボって何よ？？？…取りあえずなんかカッコイイ感じにはなったので、まぁ良いでしょう！

という訳でアーマードコアっぽい画像をSDに生成させるトライでした。遠からず一般向け公開やSDを利用したwebサービスも出て来ると思います。AI画像生成の今後の展開が楽しみですね！

最後にアーマードコア以外の出力例も載せておきます。またRedditのSDコミュニティでは海外ユーザーの投稿が見られますので他のジャンルの画像も気になる方はどうぞ。