見出し画像

プロンプト再現率高↑ 2大🐉中華動画AI「KLING」vs「hailuo」登場!

以前こちらの記事でGEN3DreamMachineのText to Video(プロンプトから動画を生成)機能を比較検証しました!

これに続いて中華系の生成動画が続々と登場しているので
以前と同じ条件(プロンプト)で検証します!

KLING

中国の快手科技有限公司(クアイショウ)による開発
快手はTikTokのバイトダンス社を追い上げる新興企業

hailuo

アリババ、テンセントなどが出資する
AIスタートアップ企業MiniMaxによる開発
同社はデジタルコンパニオン領域にも注力している

Runwayの登場から1年ちょい経ち、動画生成AIも「比較」できる時代になったんだなぁ…としみじみです
どんな事でも選択肢が増えるのはウェルカムです!

検証条件

  • 同一のプロンプトを入力

  • ガチャやプロンプトエンジニアリングはせず一発勝負

  • プロンプト内容はあえてAIが学習しにくい非現実的な状況設定

<ご注意>
今回はすぐ見られるUXを優先して圧縮率低めのGIF動画を貼り付けてありますが、記事内に複数貼り込んでいるため、モバイルだと処理落ちする可能性が高いです
その場合はGIF動画をクリックしてもらえれば動画が見られます
noteさん、有料機能で良いのでそろそろ動画にネイティブでしっかり対応してもらえると嬉しいです・・・

では開始!


お題:巨大ガニ vs. カラテマン

<プロンプト>
A crab, the same size as a human being, is fighting with a karate guy. The crab's scissors are pinching the fighter's wrist, photo-real image.
人間と同じ大きさのカニが空手の男と戦っている。カニのハサミが格闘家の手首を挟んでいる、写実的なイメージ

▼ KLINGの出力 ▼

「これイヤ~ッ 離してぇ~」

▼ hailuoの出力 ▼

「ちょちょ 痛い痛い!」

▶ KLING
空手男の嫌そうな表情が最高です!
…が、「戦っている」という状況設定と「手首を挟む」という特定の演技が実現できていませんね
カニがへばり付いてるのを嫌がっているだけ 笑
生成AIは「2つの要素が影響しあう」という表現が苦手なんですね

▶ hailuo
ハサミで手首を挟む感じが表現できていいて、空手男の動きも完全に手首を拘束されている動きです(完全に挟めてはいませんが)
あと、KLINGを見てもわかるように、AIがカニの足を正確に描くのは難しいのですが、きちんと生成できています!(本数的にタラバガニですね)
ただ残念ながら、空手男の顔が見えません
また「人間と等身大のカニ」という条件がKLING共に反映できていません

☞ 判定:どちらかと言えばhailuoの勝ち


お題:魚竜

<プロンプト>
an ichthyosaur is swimming rapidly,biting,fangs, under the blue sea, super photo real image
魚竜(イクチオサウルス)が青い海の中を猛スピードで泳ぎながら、牙をむき出しにして噛みついている、超写実的なイメージ。

▼ KLINGの出力 ▼

「早いぞ こいつ!」

▼ hailuoの出力 ▼

「出た~!半魚人!」

▶ KLING
これまでの出力の中で一番魚竜っぽいフォルムと動きをしています
ただ残念ながらこれもAIあるあるですが恐竜関連を出力すると(プロンプトにsaurが含まれると)質感が図鑑のイラストみたいになってしまう傾向が出ちゃってます

▶ hailuo
イグアナ人間のような独自の生物がたゆたっていますね
なんとも言えない出力となりました 笑

☞ 判定:KLINGの完勝


お題:虎男

<プロンプト>
A anthro-tiger with realistic fur, wearing a dark fedora, brown suit with a white shirt, and a patterned scarf, overcast sky in the background, dramatic lighting highlighting the tiger's face, gazing at the sky quietly, detailed textures on the fur and clothing
リアルな毛並みの擬人化されたトラが、暗い色のフェドーラ帽をかぶり、白いシャツに茶色いスーツ、模様の入ったスカーフを身につけている。背景には曇り空が広がり、ドラマチックな照明がトラの顔を際立たせている。トラは静かに空を見上げており、毛並みや服の質感が詳細に描かれている。

▼ KLINGの出力 ▼

「♪ 私の~お墓の前で 泣かないでくださ~い(哀愁)」

▼ hailuoの出力 ▼

「今日の夕飯はなんであろうか・・・」

▶ KLING
「紳士のような恰好のトラ人間が静かに空を見上げる」という規定を、見上げる動きを演じさせる事で豊かに表現できています
ただ残念ながら、これはKLING全体に言えるのですが、質感・色味が少しシネマ系フィルター臭いですね
制作に利用することを考えると、余計なことしてくれるな、という感じがします

▶ hailuo
こちらも規定どおり演技できています
よけいな演技を加えていないという点においては正確性はこちらが高いですね
まばたきを一度くらいしてもらえると完璧でした

☞ 判定:リアルさでhailuoの勝ち


お題:荒野のロボ

<プロンプト>
Under the cloudy sky, there stands a robot character that seems like it could appear in a modern version of "The Wizard of Oz" in the wilderness
曇り空の下、荒野に「オズの魔法使い」の現代版に登場しそうなロボットキャラクターが立っている。

▼ KLINGの出力 ▼

「オイ ツギノマチマデ マダ アルクノカ?」

▼ hailuoの出力 ▼

「ニンゲンドモヨ ズシン・・・ズシン・・・」

▶ KLING
「立っている」と規定したのですがガシガシと歩いてしまっています
歩き方自体はかなりリアルなのですが、いらない演出ではありますね
オズの現代版に登場するロボとしてのデザインはアリな気がします

▶ hailuo
この頭の形状、オズのブリキのきこりのとんがりをおそらく再現してくれているんですよね…(面白いデザインですが、いまいち好きになれません)
そしてやはりこちらも歩いちゃってますね
GEN3とDreamMachineではきちんと静止していたので、プロンプトの指定が甘いわけでもないと思います

☞ 判定:歩いちゃってるのでドロー


お題:ハサミで石を真っ二つに

<プロンプト>
A large rock sits against a dark background. Metal scissors pierce the top of the rock. The scissors begin cutting the rock, slicing it completely in two. Dust scatters from the rock. Dramatic lighting effects. The moment of cutting progresses in slow motion.
暗い背景に大きな岩が置かれている。金属製のハサミが岩の上部に突き刺さる。ハサミが岩を切り始め、完全に二つに割る。岩からは粉塵が散り、ドラマチックな照明効果が加わる。切断の瞬間がスローモーションで進行している。

▼ KLINGの出力 ▼

「ズシャ~ン」

▼ hailuoの出力 ▼

「サク チョッキン!」

▶ KLING
岩の割れ方はなかなかの迫力と正確性があります!
ただ、ほとんどのAIが苦手とする「ハサミ」の表現がやはりダメでした
AIはどうしても一枚刃か閉じている状態になってしまって、「対象を挟む」という動きが表現できないのです

▶ hailuo
AIの出力ではさみを握っている手まで表現、かつ開いていて→チョキン!と閉じる、という一連の動きを達成しているのを始めて見ました(握り方の描画は失敗していますが)
マニアックすぎますがこれをやれるAIは、静止画含めて今まで皆無だったので評価高いです

☞ 判定:進歩を感じたのでhailuoの勝ち


中華系はプロンプトの再現率が高い!

「KLING」vs「hailuo」、Text to Videoのプロンプト再現性能においては甲乙つけがたいです!
画は質感がかなり異なるので好みがわかれるところでしょう

総じて中華AIは、プロンプトをなんとか再現しようと頑張っている意図を感じます
これは創作に使おうとしているクリエイターにとっては非常にポイントが高いです

また、Text to Videoなので使用しませんでしたがCLINGのImage to Videoにみられるように、なんとかユーザーの求める動きを再現してようとする開発側の気概をUX/UIから感じます

動画生成AI周りの画期的な論文は中国の研究者名が入っている事が非常に多いので、中華系のガンガンサービスが出てくるのは必然的な結果だと思います
西欧陣営も、現状にあぐらをかいていないでもう一歩頑張って頂きたいところです!

Open AIのSORAは??

ところで西欧陣営と言えば、この状況下においてOpen AI社の、SORAはいったいどうなっているのでしょうか・・・?
今年頭の発表の延長で開発しているとなると、もう他社との差があまりないので、正直攻め込むタイミングを見失っているような気がします

CTOのムラティ氏も退任し、営利企業への転換を発表し、サム・アルトマン一人残ったOpenAIは今後どうなっていくのでしょうか・・・?

この記事が参加している募集

この記事が気に入ったらサポートをしてみませんか?