プロンプト再現率高↑ 2大🐉中華動画AI「KLING」vs「hailuo」登場!
以前こちらの記事でGEN3とDreamMachineのText to Video(プロンプトから動画を生成)機能を比較検証しました!
これに続いて中華系の生成動画が続々と登場しているので
以前と同じ条件(プロンプト)で検証します!
KLING
hailuo
Runwayの登場から1年ちょい経ち、動画生成AIも「比較」できる時代になったんだなぁ…としみじみです
どんな事でも選択肢が増えるのはウェルカムです!
検証条件
同一のプロンプトを入力
ガチャやプロンプトエンジニアリングはせず一発勝負
プロンプト内容はあえてAIが学習しにくい非現実的な状況設定
では開始!
↓
お題:巨大ガニ vs. カラテマン
▼ KLINGの出力 ▼
▼ hailuoの出力 ▼
▶ KLING
空手男の嫌そうな表情が最高です!
…が、「戦っている」という状況設定と「手首を挟む」という特定の演技が実現できていませんね
カニがへばり付いてるのを嫌がっているだけ 笑
生成AIは「2つの要素が影響しあう」という表現が苦手なんですね
▶ hailuo
ハサミで手首を挟む感じが表現できていいて、空手男の動きも完全に手首を拘束されている動きです(完全に挟めてはいませんが)
あと、KLINGを見てもわかるように、AIがカニの足を正確に描くのは難しいのですが、きちんと生成できています!(本数的にタラバガニですね)
ただ残念ながら、空手男の顔が見えません
また「人間と等身大のカニ」という条件がKLING共に反映できていません
☞ 判定:どちらかと言えばhailuoの勝ち
お題:魚竜
▼ KLINGの出力 ▼
▼ hailuoの出力 ▼
▶ KLING
これまでの出力の中で一番魚竜っぽいフォルムと動きをしています
ただ残念ながらこれもAIあるあるですが恐竜関連を出力すると(プロンプトにsaurが含まれると)質感が図鑑のイラストみたいになってしまう傾向が出ちゃってます
▶ hailuo
イグアナ人間のような独自の生物がたゆたっていますね
なんとも言えない出力となりました 笑
☞ 判定:KLINGの完勝
お題:虎男
▼ KLINGの出力 ▼
▼ hailuoの出力 ▼
▶ KLING
「紳士のような恰好のトラ人間が静かに空を見上げる」という規定を、見上げる動きを演じさせる事で豊かに表現できています
ただ残念ながら、これはKLING全体に言えるのですが、質感・色味が少しシネマ系フィルター臭いですね
制作に利用することを考えると、余計なことしてくれるな、という感じがします
▶ hailuo
こちらも規定どおり演技できています
よけいな演技を加えていないという点においては正確性はこちらが高いですね
まばたきを一度くらいしてもらえると完璧でした
☞ 判定:リアルさでhailuoの勝ち
お題:荒野のロボ
▼ KLINGの出力 ▼
▼ hailuoの出力 ▼
▶ KLING
「立っている」と規定したのですがガシガシと歩いてしまっています
歩き方自体はかなりリアルなのですが、いらない演出ではありますね
オズの現代版に登場するロボとしてのデザインはアリな気がします
▶ hailuo
この頭の形状、オズのブリキのきこりのとんがりをおそらく再現してくれているんですよね…(面白いデザインですが、いまいち好きになれません)
そしてやはりこちらも歩いちゃってますね
GEN3とDreamMachineではきちんと静止していたので、プロンプトの指定が甘いわけでもないと思います
☞ 判定:歩いちゃってるのでドロー
お題:ハサミで石を真っ二つに
▼ KLINGの出力 ▼
▼ hailuoの出力 ▼
▶ KLING
岩の割れ方はなかなかの迫力と正確性があります!
ただ、ほとんどのAIが苦手とする「ハサミ」の表現がやはりダメでした
AIはどうしても一枚刃か閉じている状態になってしまって、「対象を挟む」という動きが表現できないのです
▶ hailuo
AIの出力ではさみを握っている手まで表現、かつ開いていて→チョキン!と閉じる、という一連の動きを達成しているのを始めて見ました(握り方の描画は失敗していますが)
マニアックすぎますがこれをやれるAIは、静止画含めて今まで皆無だったので評価高いです
☞ 判定:進歩を感じたのでhailuoの勝ち
中華系はプロンプトの再現率が高い!
「KLING」vs「hailuo」、Text to Videoのプロンプト再現性能においては甲乙つけがたいです!
画は質感がかなり異なるので好みがわかれるところでしょう
総じて中華AIは、プロンプトをなんとか再現しようと頑張っている意図を感じます
これは創作に使おうとしているクリエイターにとっては非常にポイントが高いです
また、Text to Videoなので使用しませんでしたがCLINGのImage to Videoにみられるように、なんとかユーザーの求める動きを再現してようとする開発側の気概をUX/UIから感じます
動画生成AI周りの画期的な論文は中国の研究者名が入っている事が非常に多いので、中華系のガンガンサービスが出てくるのは必然的な結果だと思います
西欧陣営も、現状にあぐらをかいていないでもう一歩頑張って頂きたいところです!
Open AIのSORAは??
ところで西欧陣営と言えば、この状況下においてOpen AI社の、SORAはいったいどうなっているのでしょうか・・・?
今年頭の発表の延長で開発しているとなると、もう他社との差があまりないので、正直攻め込むタイミングを見失っているような気がします
CTOのムラティ氏も退任し、営利企業への転換を発表し、サム・アルトマン一人残ったOpenAIは今後どうなっていくのでしょうか・・・?
この記事が参加している募集
この記事が気に入ったらサポートをしてみませんか?