生成AIでマンボウを悠々と泳がせたかったのに…!
ここ1年でAIのイメージ生成技術はかなりのレベルに到達していて
美少女とかサイバーパンクとかファンタジーなど、ネット上で人気のあるもの、需要があるものは相当な高品質で出せます
でも、作品をあれこれと作っていると、全く出力できないイメージにまだまだ出会います
そんな時「学習していないものは出せない」というAIの基本に改めて気付かされるのです
そう、出ないものはホントマジで出ないんです!
クリエイターが
生成AIで本来やりたいのは
未知の表現
△ 手軽に高品質なイメージを生成する
仕事の資料に添える、SNSの投稿に彩りを加えるなど、旧来手間がかかっていた作業を爆速化する「カイゼン」にはめちゃくちゃ向いています
◎ CGを使っても表現が難しい、未知の表現を創造する
クリエイターとしては、本来こっちがやりたいんです…
でもAIは「未知」の表現が本当に苦手です
学習していないものをプロンプトで描そうとするとかなりの根気とテクニックが必要になります(そして現状そのコストが見合っていません)
更に言えば
未知の表現どころか、世の中のニーズからちょっと外れたイメージを生成しようとしただけで、かなりの頻度でガチャ地獄に落下するハメに!
すなわち
作品を制作する過程で空費されたAI生成物の魂と自分の時間を供養すべく「絶対生成できない」やつを記録しておこうと始めたのがこの「できない」シリーズです
今回のお題は「マンボウ」
そもそも英語で何と入力するかでつまづきます
翻訳で出てくる「Sunfish」ではまずマンボウは出ず金魚のような赤い魚が生成されます
「Ocean Sunfish」「Mola Mola」の2つでやっとそれらしいものが出始めるのですが・・・
MidJourney
プロンプト「OceanSunfish」のみでは
ほど遠い感じです
▼
「Mola Mola」を足すと
カワハギのような紙風船のような
モンスターフィッシュが続々と生まれます
▼
ガッチガチにプロンプトで
容姿を説明しても
びくともしません
▼
実物のイメージガイダンスをつけても
このありさま
どうやらMidJourneyは
マンボウに興味がないようです!😆
▼
GPT4o+Dall-E
LLMの強みを利用すべく
マンボウについてひととおり
GPTに説明させてから
続けて画像生成します
▼
冷静に実物と比較すると全然違います
AIは雰囲気で似せてくるので
生成ガチャで何回も出力していると
だんだん正解な気がしてきます
しかしここで騙されてはいけません!
現実と照らし合わせて
熱くなった自分の目を冷ましてやる必要があります(経験則)
個人的には
Dall-E特有の昔の図鑑イラストのようなぬるいリアル画風もかなり気になります
Stable Diffusion 3 Ultra
リリースされたばかりの
最新版かつ最上位モデルで挑戦です
▼
SDの素のモデルには
さすがに荷が重いみたいです
SD3は描画力が高いだけに不思議に実物感のあるナゾ生物にはなっていて
クリエイター視点ではUMA動画にするなど
何かに使えそうで「面白」くはあります
…が
本来の目的「マンボウの生成」においては最もダメでした!
生成できない理由
あくまで推測ですが下記のような事だと考えられます
そもそもマンボウの生息数が少ない
当然鮮明なマンボウの写真画像がネット上に少ないためあまり学習されていない
「魚」という概念から外れている独特すぎる形状のため、AIがうまく学習できていない、また形状を推測できない
特に尾びれの形状が唯一無二すぎる
同じような条件にあたるものはだいたい生成できません
例えば「シーラカンス」
オマケ1:
話題の最新動画AIで生成してみる
Runway Gen-3
静止画で出せないのに動画AIで一発生成できるはずもないのですが、SORAに迫るリアルさだと話題のRunway Gen-3でもテストしてみましたよ!
# プロンプト
The sunfish has a very distinctive body shape. It has a round, laterally compressed body, appearing almost disk-like or oval when viewed from the side. The body is flattened from side to side, giving it a thin profile when viewed head-on.
Fins: It lacks a true tail fin; instead, it has a clavus, a rudder-like structure formed by the convergence of the dorsal fin and the anal fin. These two fins are large and extend vertically, almost symmetrically, from the top and bottom of the body
すがすがしいほどのガン無視っぷりです!
オマケ2:
仕方がないので実在の写真を動画で泳がせる
Creative Commons + Dream Machine
北欧最大の水族館「Nordsøen Oceanarium」がマンボウの鮮明な写真をCreative Commonsで提供してくれているので
これを話題のDreamMachineで動かしました
なんか尾びれが
ヨレヨレに伸びちゃってますけど。
一応泳いだので これにて終了します!
「マンボウを出せたよ!」
って方がいらっしゃったら
是非コメントでご一報ください
2024年8/30 後日談:「Imagen3」登場!
Googleがローンチした「Imagen 3」を試したところ
バチっと一発で出せました!!!
厳密に見ると、胸ビレが普通の魚っぽく筋が入っていたりするのですが、「マンボウ」のAI出力画像としては十分なクオリティと言えるのではないでしょうか
Googleは20年近く遍く蓄積してきたインターネット上の画像データベースを持っているので、ついに本気出し使ってきた、というところでしょうか(いよいよ法的にも戦えると、と判断したのかもしれません)
残念ながらシーラカンスは今一歩でした…
尾びれの形など、従来の他モデルよりは頑張ってシーラカンス味を出していますが、まだ学習が足りないようです