こんにちは。近頃イラスト界隈ではMidjourneyが注目を集めていますが、画像生成AIの分野ではMidjourney以外のAI開発も盛んに行われています。私が最近β参加している『StableDiffusion』は、運営が管理するサービスを通じて提供される形体が多い画像AIの中でも、「オープンソースで誰でも自由に使えるAI」を目指してStability AIが開発しているものです。オープンソースの言語AIであるGPT-J-6BやGPT-NeoXなどで知られるEleutherAIも開発に協力しており、このStableDiffusionは既にgithubでソースが公開されています。学習済みモデルの研究者向け提供も始まっていて、個人向けの公開も順次行われる模様です。画像AIの動作には強力なGPUが必要になるものですが、技術進歩により小規模モデルでも高度な画像が出力できるようになってきており、StableDiffusionはなんとVRAM容量10GB以上の個人用GPUで動作すると言うので驚きです。
βへの参加申請はこちら。(2022/08/20 web版がサービス開始したのでβは終了しました。)
StableDiffusionはオープンソースですので、今後様々なwebサービスを通じてこの画像AIを触る機会があるかと思います。海外のAI小説サービスのNovelAIも挿絵生成の為に取り入れる予定のようで、デモンストレーションを公開しています。
前置きが長くなりましたが、今回はStableDiffusion(以下:SD)にアーマードコアっぽい画像を出力させてみましたので、その試行錯誤の過程をご覧ください。本当は「ツイッターでよく見るMidjourneyでアーマードコアっぽい画像生成してる人みたいなのがやってみてぇ~」と思ったんだけど、Midjourneyの課金が切れていたのだ。
取りあえず「armored core 4」だけ入力して出て来た画像。ロボですね。SDのβでは基本サイズである512*512の画像が1枚5秒程度で生成されます。もちろん任意にサイズ変更したり、一度に最大9枚までの画像生成が可能です。スケールアップ機能は無いので、そちらは別で行うしかないけど。
「AI画像のクオリティ上げたきゃUnrealEngineって書き加えろ」と言われる"UnrealEngine"を加えて生成。3DっぽくなってAC4感が出て来ましたね。でも今回は3DっぽいACじゃなくてイラストっぽくしたいのだ。
サイズを変更してトライ。SDのAIは512*512をベースに思考しているので、あまり横長にし過ぎると要素の重複が起こるので注意。("一人の"と指定した人物が二人出てきたり、構図内のパースの消失点が二つになったり)
うーん、結構良い感じなってきたけど、まだちょっと思ってるんと違うのだ。幸いSDのβは””完全無料””なのでリトライはいくらでもできます。ありがてぇーっ!!
一時間ほど試行錯誤して疲れてきたので脱線…。ネットで拾ってきた画像じゃなくてSDで生成した画像ですよぉーっ!御覧の通りSDは実写性能が高く、人体バランスを結構保ってくれます。ただMidjourneyっぽい色の濃い水彩っぽい雰囲気がありつつ線がパキッとしてる感じのを再現したかったですが、ちょっと難しいですね。何て入力すれば良いのか分からぬ。AIにMidjourneyの画像を学習させればMidjourney以外のAIも「Midjourneyっぽく」でMidjourney再現できるようになるんちゃう?
そんな訳でトライを繰り返して最終的に良い感じになったのがこちら!!
あ~、いいっすねぇ!生憎SDは「アーマードコア=なんかロボっぽいやつっしょ?」くらいの認識なようで、どちらかというとバトルテックっぽいロボになってしまいがちなようです。でもACだってタンク脚とか四本脚とか武器腕とかある訳だし、23系と4系とV系は違うし、そもそもACっぽいロボって何よ???…取りあえずなんかカッコイイ感じにはなったので、まぁ良いでしょう!
という訳でアーマードコアっぽい画像をSDに生成させるトライでした。遠からず一般向け公開やSDを利用したwebサービスも出て来ると思います。AI画像生成の今後の展開が楽しみですね!
最後にアーマードコア以外の出力例も載せておきます。またRedditのSDコミュニティでは海外ユーザーの投稿が見られますので他のジャンルの画像も気になる方はどうぞ。