【動画生成AI】最高品質のAI動画が作れるKling AIの実力

2024年7月26日 21:36

👋こんにちは！AI-Bridge Labのこばです！

今回は、高度な物理シミュレーションを搭載したAI動画サービスKling AIについてご紹介します！
Klingを使うと、プロンプトや静止画から以下のような動画を簡単に作ることができます

Stable Diffusionで生成した画像からアニメーションさせてみました🎥

シンプルでもプロンプトの効きが良く映像の破綻も少ないので、現時点で一般公開されている動画生成AIの中ではトップのクオリティといって良いと思います

アニメ系のi2v性能はLumaと同じかちょっと上の印象です#klingai #Kling pic.twitter.com/w0evFRZQKH
— こば@AIBridge Lab (@doerstokyo342) July 25, 2024

映像を見ていただくと元画像ではアングル的に見えていない部分があっても、立体的に補完してくれているのがわかりますね！

以前から、中国の電話番号を取得済みの方は利用ができていたのですが、この度メールアドレスを登録すればだれでも使えるようになりました。

Klingの概要や使い方、他の動画生成AIとの比較、今後のアップデート予定などについて分かりやすく解説します！

1.Kling（クリング）とは？

Kling（クリング）は、中国の快手科技有限公司（クアイショウ）によって開発された動画生成AIです。現在は5秒の動画をテキストや画像から生成でき、自然な動きとリアルな映像を実現します。

2.Klingの特徴

高解像度：1080pの高解像度でレンダリングします。
物理シミュレーション：リアルな物理シミュレーションを搭載し、現実世界の物理法則に従った映像表現を実現します。
3Dフェイス/ボディ再構築：一枚の全身写真から完全な表情と四肢の動きを制御します。
ネガティブプロンプトの指定：動画として出したくない否定的要素を指定することでより良い結果を得る可能性を高めます

3.Klingの機能

AI Image：プロンプトをもとに画像を生成

画像をアップロードしてスタイルを参照することもできます

AI Video：テキストから動画を生成

静止画像の5秒動画への変換：AI Videoの機能で静止画像を5秒の動画に変換することができます。

4.Klingの基本的な使い方

1.Klingのウェブサイト(https://klingai.com/)にアクセスし、登録手順に従ってアカウントを作成します。
メールアドレスとパスワードを登録すれば認証コード付きのメールが届きますので、そのコードを入力フォームに入れてログインします。

2.ログイン後、ダッシュボードからAI Videoを選び、「Text to Video」または「Image to Video」を選択します。

3.テキストプロンプトを入力するか、画像をアップロードして動画を生成します。今回はテストとして、テキストのみで「日本の侍がファーストフード店に座ってハンバーガーを食べています。カメラは固定されています。テーブルの上にはコーラが置いてあります。」という文章を英語にして入力してみます

▼ネガティブプロンプトは以下を指定

blur, distortion, disfigurement, low quality, collage, grainy, logos, abstract, illustrations, computer-generated, warped

1分ほど待つと動画が生成されました
指定した要素を含んでいて、非常に精度が高いことが分かります

4.生成された動画を確認します。
現時点ではまだ課金プランが準備中のためウォーターマーク（右下のロゴ）が記載された状態になりますが、自由に動画をダウンロードすることができます。

5.今後のアップデート予定

Kling AIはまだテスト版ですが、既に今後実装予定の機能をいくつか確認することができます。それらを以下にご紹介します！

5-1.Settingセクション

・High Qualityモード
ビジュアルクオリティの高い動画が生成できるようになるモードが解放予定です。現在は、高速生成のHigh Performanceモードのみ選択可能

・動画の尺
現在は5秒のみ選択可能ですが、10秒の動画生成に対応する予定です

5-2.Image to Videoセクション

・Add End Frames
最終フレームの画像を指定することができます。Luma AIにもある中割り生成(キーフレーム)機能ですが、最初と最後の原画が必要になりますが、これがあると狙った映像を作りやすくなります。

5-3.出力結果セクション

・Extend機能
生成した動画を+5秒延長します。
現時点ではこの機能がないので、延長するためのテクニックとして「GPT-4oなどに動画を渡して最終フレームを抽出してもらい、それを最初のフレームとしてimage to videoし直す」という方法で延長することができます。
ただ、この方法だと動画のコンテキスト（文脈）が保持されないので、クオリティ的にはExtend機能で作るほうが良くなるとは思います。

GPT-4oに画像内のように指定すれば簡単に最終フレームを取得することができます

6.他の動画生成AIとの比較

現時点で、ハイクオリティなimage to videoが可能なLuma AI、テキストから最高品質の生成できるRunway Gen3と比較しました。

画像(+テキスト)から動画を生成するパターンで、Luma AIのDream Machineと比較しました

Lumaもすごいのですが、Klingの方が破綻なく大きく動いているにも関わらず自然な見た目です。LumaとKlingの大きな違いは、物理シミュレーションの精度の高さと推測しています。

Kling AIのimg2video使ってみました！
装飾や服、風の表現などかなり細かく連動して動き、自然な動画になりますね！

<比較用>
←Kling AI　　Luma AI→ pic.twitter.com/YewGX4KOsZ
— こば@AIBridge Lab (@doerstokyo342) July 25, 2024

テキストから動画を生成するパターンで、Runway Gen3-alphaと比較しました

Runway Gen3はアジア系の要素を生成するのが苦手ですが、動画の品質や動きの自然さはKlingを凌いでいると思います。
逆に、Klingは少し品質が劣るものの、プロンプトを忠実に再現し作りたい動画が作れています。

Text 2 Videoの比較

←Kling AI　　Runway Gen3→

侍とか日本人の理解度の違いが顕著ですがｗ
動画の精度はRunway、プロンプト忠実度はKlingという感じ

プロンプト
A Japanese samurai sits at a fast food restaurant and eats a hamburger. The camera is fixed. There is a cola on the table. pic.twitter.com/ZYoozVdKgA
— こば@AIBridge Lab (@doerstokyo342) July 26, 2024

7.アニメ系の動画について

いくつかアニメ系のimage to Videoについても試してみたのですが、ある程度問題なく動いてくれました。実写系に比べると動きの違和感は少しあります。
まだ大量には試せていないですがLuma AIよりも精度や成功率は高そうです。

『桜並木を歩く前田慶次』
Midjourney → Klingで静止画を動画にしました🌸
厚塗りっぽいイラストでも一貫性を保ったまま綺麗に動かしてくれます#AI動画 #klingai pic.twitter.com/O0QEsJGBjm
— こば@AIBridge Lab (@doerstokyo342) July 26, 2024

アニメ系のimage to video動画も検証中 pic.twitter.com/sclcF7jdCt
— こば@AIBridge Lab (@doerstokyo342) July 26, 2024

8.利用規約およびプライバシーについて

Klingの利用規約とプライバシーポリシーは以下のページから確認できます。
利用するユーザーが注意しておくべき点を抜粋しておきましたので、ご一読頂くと良いかと思います。

・ユーザーコンテンツの責任: Klingは、ユーザーがアップロードまたは公開したコンテンツが適用される法律、規制、およびKlingの利用規約に準拠していることを確認する責任をユーザーが負うことを強調しています。
Klingにアップロードしたコンテンツが、第三者の権利を侵害したり、違法なものでないことを確認する必要があります。

・ユーザーコンテンツの使用許諾: Klingは、ユーザー生成コンテンツを非専有かつ非機密とみなし、Kling AIの提供と改善のために使用できるライセンスをユーザーに付与しています。
具体的には、ユーザーは、アップロードしたコンテンツをKlingがサービスの運用期間中および事業の地理的範囲内で、様々な方法で使用することを許可することになります。

・ユーザーコンテンツの公開範囲: Kling AI の設定を通じて、コンテンツの利用範囲（他のすべてのユーザー、選択したユーザー、または自分だけに公開するかどうか）を決定および/または制御できます。自分のコンテンツを誰が見ることができるかを設定で確認し、プライバシーを守りましょう。

9.まとめ

今回は中国版Sora、至高の動画生成AIの一つであるKling AIについてご紹介しました。
まだテスト版ではありますが、Luma AIのように高品質なImage To Video機能を持ちながら、Runway Gen3に並ぶかそれ以上のプロンプト再現性を持った、ハイクオリティなサービスだと感じました。

今後のアップデートが非常に楽しみです！

2024年の夏は動画生成AIの進化が目まぐるしく、新しいサービスや技術が発表されています。このKlingの全世界公開はその中でも特に注目のニュースと言えるでしょう。

10.AI-Bridge Lab について

AIを使った課題解決や業務効率化に興味のある方は、ぜひAI-Bridge Lab.までご相談ください。経験豊富なコンサルタントが、御社の状況に合わせたAI活用をご提案させていただきます。お問い合わせ、お待ちしております！

ご依頼等は以下のメールアドレスまでお気軽にお問い合わせください。

ai_business@doerstokyo.jp

気に入っていただけたら、Xのフォローもぜひお願いいたします！

『モノクロホラー映画』
Midjourney → Klingで動画化しています

実写ホラー作品はたくさん学習されているためか、破綻も少なく動きもスムーズです👻#AI動画 #klingai pic.twitter.com/ewdG0ljkhC
— こば@AIBridge Lab (@doerstokyo342) July 26, 2024

皆さまの温かいサポートのおかげで、活動を続けることができています。もしよろしければ、引き続き支援をお願いできますと幸いです。より質の高い記事投稿に励みます！