見出し画像

新二大動画AI「GEN3」vs「DreamMachine」使ってみた結果


GEN-3 alphaが使用可能になったので
さっそくDream Machineで先にテスト生成していたものと同じプロンプトを入れて比較しました

※ 残念ながらGEN-3にはまだImage to Video機能が未搭載のため
プロンプトからのワンショット生成での比較です
  →搭載されました

短い動画の寄せ集めですが
両者の違いが
気になる方はご参考にどうぞ!


巨大ガニ vs. カラテマン

生成AIは学習元に絶対にないようなオリジナルの状況設定は苦手なのですが、
最新のバージョンは力技でそれっぽいものを出力できるようになってきました

プロンプトに特に設定していないのに、両者ともに海岸でバトルしているのがおもしろいです!

#プロンプト
A crab, the same size as a human being, is fighting with a karate guy, Crab's scissors is pinching fighter's wrist,photo-real image

▶ Dream Machine
カニだかなんだかわからない、遊星からの物体Xみたいなクリーチャーが生成されました
カラテマンが死闘している雰囲気は出てますね

▶ GEN-3
巨大カニっぽいもの
が生成できました
カラテマンが道着を着ているのもポイント高いです
カニがひっくり返りそうなところまで物理シミュレーション頑張っている感じも好感です!

☞ 判定:GEN-3の勝ち


魚竜

イルカやカジキのように見えますが、魚竜は恐竜時代に生きていた海棲の爬虫類です

イクチオサウルス
ichthyosaur wikipedia

現存しない生き物なので、そもそも静止画でも学習データが極端に足りません
難しいですが、両者ともに頑張ってワニと魚を合体させたようなクリーチャーを創造してくれました

#プロンプト
an ichthyosaur is swimming rapidly,biting,fangs, under the blue sea, super photo real image

▶ Dream Machine
頑張りましたが、ゴムの着ぐるみのような気味の悪い謎生物に……残念!

▶ GEN-3
こちらも形は全然あっていないのですが、ヒレのなびき具合など、表現力で説得力ある動画になっています
魚竜を良く知らない人がパっと見たら納得するレベルかもしれません

☞ 判定:表現力でGEN-3の圧勝


虎男

人気ありそうなモチーフなので、ネットにも学習できる獣人系のデータが充分にあったのでしょう
両者ともに上手く生成できました

#プロンプト
A anthro-tiger with realistic fur, wearing a dark fedora, brown suit with a white shirt, and a patterned scarf, overcast sky in the background, dramatic lighting highlighting the tiger's face, gazing at the sky quietly, detailed textures on the fur and clothing

▶ Dream Machine
センス悪い感じのスカーフ
が効いてますね
マフィアのボスのような貫禄があります

▶ GEN-3
プロンプトへの忠実度から行くと、演技においてこちらの方がより正確な出力でした
服装はそこまで細かく指定していないのですが、DreamMachineとほぼ同じいでたちなのが面白いです

☞ 判定:ドロー


荒野のロボ

「曇り空の下、荒野にたたずむ『現代版オズの魔法使い』に出て来そうなロボットキャラ」という、ちょっと複雑なニュアンスの指定です

#プロンプト
Under the cloudy sky, there stands a robot character that seems like it could appear in a modern version of "The Wizard of Oz" in the wilderness

▶ Dream Machine
全体として雰囲気がよくでていると思います。
欲を言えばロボの質感してもちょっとのっぺりしてるかもしれません
あと、デザインにオズっぽい要素が見当たらないですね

▶ GEN-3
顔のデザインが古臭い人型なのは「オズ」のブリキの木こり要素が働いているのかもしれません
ロボットダンス的なぎこちない動きを多少しているのが良いです

☞ 判定:僅差でDreamMachineの勝ち


ハサミで石を真っ二つに

この手の非現実的な表現は最高に難易度が高い上、加えて「ハサミ」は静止画でも生成に失敗しがちな難しいモチーフです
現実にはあり得ない状況設定を、そもそも描くのが苦手なモチーフで生成させるとかなりの確率で破綻します

# プロンプト
A large rock sits against a dark background. Metal scissors pierce the top of the rock. The scissors begin cutting the rock, slicing it completely in two. Dust scatters from the rock. Dramatic lighting effects. The moment of cutting progresses in slow motion

▶ Dream Machine
ハサミでない何か刃物が、石に接触もできず消え去ってしまっています
0点です

▶ GEN-3
ハサミの描画に失敗していますが
石を破壊しようとしている動きまではなんとか表現できています…とはいえ…

☞ GEN-3の方が頑張りましたが、両者ともに条件を満たしていないので失格です


以上、ザックリとしたテストですがいかがでしたか?

クリエイターとしての実際の使い道を考えると
Image to Video機能の精度とコントロール性が全てなので
本当の戦いはここからでしょう!
そして、SORAの開発状況はどうなっているんでしょうか…?

GEN-3はGEN-2の時と同様に、ユーザーと競合の様子を見ながら
段階的に機能を解放してくるのかもしれませんね

なお、現状の各種Image to Video機能を使って
生成ガチャを頑張って回すと
こんな感じのアウトプットが制作可能です

動画生成AI、そこそこ何かに使えそうなレベルになってきています!

いいなと思ったら応援しよう!

この記事が参加している募集