見出し画像

初音ミクがアイスコーヒーを飲めるまで

当記事は、以下の企画に#ai創作として寄稿するものです。


はじめに


画像生成AI、使ってる?自分はめーーっちゃ使ってる。日夜しょうもない画像を生成してるよ。

生成しすぎだ。
 
せっかくだし、2022年の画像生成AIの歴史を振り返ってみよう。

あと、各AIの画像生成能力の指標として「初音ミクがアイスコーヒーを飲んでいる」を生成してみた。
ただの初音ミクを生成するより難しそうだから。

果たして初音ミクはアイスコーヒーを飲めるのだろうか。
(この記事で取り上げる画像生成AIは自前の環境を必要としない、アプリやサイト上で動くものとします。)
 

Dream by WOMBO


今年初めて話題になった画像生成AIは“Dream by WOMBO”
 
「概念が生成できるAI」として今年の一月中旬にちょっとだけ話題になったAI。

「博麗霊夢」


これがDream by WOMBOで生成した画像。

うん……「概念」っていうだけあってキャラクターの名前を入力しても人の形すらとっていない。「加工前」って感じがすごいある。
 
じゃあ「初音ミクがアイスコーヒーを飲んでいる」画像を生成してみよう。

まあこんなもんよ。ピンクと水色と肌色の何かが絡み合ってる。

手前にアイスコーヒーのカップっぽいものも見えるし、AIの意図はわからんでもない。だけどこれを「初音ミクがアイスコーヒーを飲んでいる」画像とは言えない。

DALL-E Mini(現Craiyon)

少し時間は経って五月初旬にリリースされたAI。あまり大きくは話題にならなかったけど。
 
試しに「白い猫」の画像を生成してみよう。 

かなり良い。目が妙に濁ってるのが気になるけどさっきの概念体に比べたら飛躍的な進歩を感じる。

じゃあ「初音ミクがアイスコーヒーを飲んでいる」画像を生成してみよう。 

はい。
さすがにさっきの猫の画像ほど整ってはないけど、初音ミクなのはわかる。

片手にアイスコーヒーっぽい何かを持っているようにも見える。人の形をしてるけど色々溶けてるね。特に目。目が怖いよ… 

Midjourny

 
七月上旬にβ版が公開されたAI。これは大きく話題になったから知ってる人は多いかもしれない。

「コンピューターおばあちゃん」とか「スターバックス ヤーナム支店」とかがバズってた。ちなみにMidjournyが話題になり始めたのは八月の上旬になってから。
 
試しに「ニューロマンサー、サイバーパンク」「人魚の魔女」で画像を生成してみよう。

いいね。繊細で独特の魅力がある。
AIが生成した画像特有の気味悪さを逆手にとって、AIにしか出せない雰囲気を醸し出してるように感じる。
 
じゃあ「初音ミクがアイスコーヒーを飲んでいる」画像を生成してみよう

あれ?なんだこれは…

なるほど。どうやらMidjournyはいわゆる「萌えキャラ」みたいな女の子を生成することに長けていないみたいだ…

DALL-E2


七月下旬に公開されたAI。話題性に関しては少しMidjournyの影に隠れてしまったような印象だけど、能力的にはMidjournyより高い印象。
 
例えば、「ビリヤードの八番玉」と入力すると

こんな画像が生成される。Midjournyが絵画的な画像なのに対してDALL-E2はCG的な画像って印象。もちろんイラストも生成できる。

これは「タブレットを操作する宇宙飛行士(イラスト)」。アナログ画材っぽいタッチ。
 
じゃあ「初音ミクがアイスコーヒーを飲んでいる」画像を生成してみよう。

お!!!
かなりいい。初音ミクとアイスコーヒーがしっかり描かれてる。一気に「初音ミクがアイスコーヒーを飲んでるイラスト」に近づいたと思う。

ちなみに、他に生成した画像はこんな感じ。

アイスコーヒーを飲めてる気がするけど、ストローと顔が変な感じになっちゃってる。

Stable Diffusion


八月下旬に公開されたAI。ワンピースっぽい画像とかドラゴンクエストっぽい画像を生成できるということで若干話題になっていた印象。

九月下旬に問題になった洪水のフェイク画像はこのAIで作られたらしい。
 
「宇宙服を着た猫」の画像でも生成してみよう。

いいね、すごく写真っぽい上にCG感もない。最初の方に紹介したDALL-miniよりもクッキリしてるしディティールも細かい。
 
じゃあ「初音ミクがアイスコーヒーを飲んでいる」画像を生成してみよう。
 

なるほど。かなり写真寄りだけど初音ミクとアイスコーヒー(のカップ)が生成できてるように見える。アイスコーヒーを飲めてはいないけど。

アイスコーヒーのカップは透明の蓋まで描かれててやけにリアル。
 
ちなみにこのStable Diffusion、無償公開されてる上に情報を追加して再公開するのも自由。
これ以降に公開されてるAIはほとんどStable Diffusionをベースに作られているんだからびっくり。

簡単に言うと、レベル50まで育成した画像生成AIが無料で配られてて自由に育成できるってこと。ヤバいね。
 

NovelAI

十月初旬に公開された二次元イラストに特化したAI。Midjournyに次いで知ってる人が多いかもしれない。

ラーメンを食べる樋口円香のイラストとか、ケーキに埋められてる女の子のイラストがネットミーム的に話題になった反面、自作発言やAI疑惑をかけられるイラストレーターなど様々な面で話題になったAIという印象。

個人的に今年一番使った画像生成AI。冒頭に示したフォルダの中の九割はこのAIで生成した画像。

とりあえず「女の子」の画像を生成してみよう。

圧巻の一言に尽きる。
今まであった「AIの生成した画像感」を完璧に払拭している印象。すごいね。クオリティ上がりすぎでは?

Twitterで2万人くらいフォロワーのいる知らんライトノベルの挿し絵を担当してるイラストレーターが描いた1.1万RT 3.2万いいね のイラストって感じ。見たことあるよこういうイラスト。

じゃあ「初音ミクがアイスコーヒーを飲んでいる」画像を生成してみよう。

完璧!!!!!
まごうことなき「初音ミクがアイスコーヒーを飲んでいる」画像だ!
しかもフラペチーノっぽいの飲んでるし!!!

完成したけどまだ終わりじゃない。次のAIが控えているんだ…

nijijourny

十一月上旬にクローズドβテストを開始したMidjournyの二次元イラスト特化モデル。

二次元イラスト特化と言えば前述のNovelAIともろ被りしているが、いかに差別化が図られているか気になる。

NovelAIと同じように「女の子」を生成してみよう。

(四枚の画像が一気に生成される)

凄まじい。
NovelAIで正直頭打ちかと思ったけどまだクオリティを上げてくるかね。

ちなみにこのnijijourny、ベースがここに至るまでで鍛え上げらえたMidjournyなので、「二次元イラスト特化」と言えどそれ以外のイラストも生成できるらしい。女の子以外で適当に生成してみよう。


「炸裂するリンゴ」
「ビールを飲む犬」
「宇宙旅行会社のロゴマーク」

すごい。ここまで来たかAIは…仮にこれらのイラストを実際に使ったとしても「AIのイラストを使う先進的な試み」って感じはないね。むしろ良いイラストだねってなっちゃう。ちなみにこの記事のサムネイルはこのAIで生成したもの。

じゃあ「初音ミクがアイスコーヒーを飲んでる画像」を生成してみよう。万感の思いを込めて。

超えてきた。
超えてきたよ…それも大きく。
繊細な絵柄で当たり前のようにアイスコーヒーが描写されてるし、背景もカフェっぽい。

しかもnijijournyの特徴として「絵柄が一定じゃない」というものがあるので、

こんなふうにAIに指示する文を変えなくても違う絵柄で生成される。
NovelAIの絵柄はほぼ一定で、慣れると「ああNovelAIで生成した画像だな」ってなるからその点でも大きく超えてきている印象。

おわりに

はい。
この記事を作成している十二月時点ではnijijournyが最新なのでここまでとなります。好みのシチュエーションのイラストを生成するということは完璧にできたから、次は絵柄を保持し続けることが課題になりそう。

恐らくこれからはもっと進歩したAIが続々と発表されるでしょう。それが悪い使い方をされることなく、幸せな使い方をされるといいですね。

(Trinartはいじってなかったので画像がありませんでした。ゆるして)


この記事が気に入ったらサポートをしてみませんか?