見出し画像

【動画生成AI】最高品質のAI動画が作れるKling AIの実力

👋こんにちは!AI-Bridge Labのこばです!

今回は、高度な物理シミュレーションを搭載したAI動画サービスKling AIについてご紹介します!
Klingを使うと、プロンプトや静止画から以下のような動画を簡単に作ることができます

映像を見ていただくと元画像ではアングル的に見えていない部分があっても、立体的に補完してくれているのがわかりますね!

以前から、中国の電話番号を取得済みの方は利用ができていたのですが、この度メールアドレスを登録すればだれでも使えるようになりました。

Klingの概要や使い方、他の動画生成AIとの比較、今後のアップデート予定などについて分かりやすく解説します!


1.Kling(クリング)とは?

Kling(クリング)は、中国の快手科技有限公司(クアイショウ)によって開発された動画生成AIです。現在は5秒の動画をテキストや画像から生成でき、自然な動きとリアルな映像を実現します。

2.Klingの特徴

  • 高解像度:1080pの高解像度でレンダリングします。

  • 物理シミュレーション:リアルな物理シミュレーションを搭載し、現実世界の物理法則に従った映像表現を実現します。

  • 3Dフェイス/ボディ再構築:一枚の全身写真から完全な表情と四肢の動きを制御します。

  • ネガティブプロンプトの指定:動画として出したくない否定的要素を指定することでより良い結果を得る可能性を高めます

3.Klingの機能

  • AI Image:プロンプトをもとに画像を生成

画像をアップロードしてスタイルを参照することもできます

  • AI Video:テキストから動画を生成

  • 静止画像の5秒動画への変換:AI Videoの機能で静止画像を5秒の動画に変換することができます。

4.Klingの基本的な使い方

1.Klingのウェブサイト(https://klingai.com/)にアクセスし、登録手順に従ってアカウントを作成します。
メールアドレスとパスワードを登録すれば認証コード付きのメールが届きますので、そのコードを入力フォームに入れてログインします。

右上のSign inを押してメールアドレスを登録します

2.ログイン後、ダッシュボードからAI Videoを選び、「Text to Video」または「Image to Video」を選択します。

3.テキストプロンプトを入力するか、画像をアップロードして動画を生成します。今回はテストとして、テキストのみで「日本の侍がファーストフード店に座ってハンバーガーを食べています。カメラは固定されています。テーブルの上にはコーラが置いてあります。」という文章を英語にして入力してみます

▼ネガティブプロンプトは以下を指定

blur, distortion, disfigurement, low quality, collage, grainy, logos, abstract, illustrations, computer-generated, warped
1分ほど待つと動画が生成されました
指定した要素を含んでいて、非常に精度が高いことが分かります

4.生成された動画を確認します。
現時点ではまだ課金プランが準備中のためウォーターマーク(右下のロゴ)が記載された状態になりますが、自由に動画をダウンロードすることができます。

5.今後のアップデート予定

Kling AIはまだテスト版ですが、既に今後実装予定の機能をいくつか確認することができます。それらを以下にご紹介します!

5-1.Settingセクション

・High Qualityモード
ビジュアルクオリティの高い動画が生成できるようになるモードが解放予定です。現在は、高速生成のHigh Performanceモードのみ選択可能

・動画の尺
現在は5秒のみ選択可能ですが、10秒の動画生成に対応する予定です

5-2.Image to Videoセクション

・Add End Frames
最終フレームの画像を指定することができます。Luma AIにもある中割り生成(キーフレーム)機能ですが、最初と最後の原画が必要になりますが、これがあると狙った映像を作りやすくなります。

5-3.出力結果セクション

・Extend機能
生成した動画を+5秒延長します。
現時点ではこの機能がないので、延長するためのテクニックとして「GPT-4oなどに動画を渡して最終フレームを抽出してもらい、それを最初のフレームとしてimage to videoし直す」という方法で延長することができます。
ただ、この方法だと動画のコンテキスト(文脈)が保持されないので、クオリティ的にはExtend機能で作るほうが良くなるとは思います。

GPT-4oに画像内のように指定すれば簡単に最終フレームを取得することができます
抽出された最終フレーム

6.他の動画生成AIとの比較

現時点で、ハイクオリティなimage to videoが可能なLuma AI、テキストから最高品質の生成できるRunway Gen3と比較しました。

画像(+テキスト)から動画を生成するパターンで、Luma AIのDream Machineと比較しました

Lumaもすごいのですが、Klingの方が破綻なく大きく動いているにも関わらず自然な見た目です。LumaとKlingの大きな違いは、物理シミュレーションの精度の高さと推測しています。

テキストから動画を生成するパターンで、Runway Gen3-alphaと比較しました

Runway Gen3はアジア系の要素を生成するのが苦手ですが、動画の品質や動きの自然さはKlingを凌いでいると思います。
逆に、Klingは少し品質が劣るものの、プロンプトを忠実に再現し作りたい動画が作れています。

7.アニメ系の動画について

いくつかアニメ系のimage to Videoについても試してみたのですが、ある程度問題なく動いてくれました。実写系に比べると動きの違和感は少しあります。
まだ大量には試せていないですがLuma AIよりも精度や成功率は高そうです。

8.利用規約およびプライバシーについて

Klingの利用規約とプライバシーポリシーは以下のページから確認できます。
利用するユーザーが注意しておくべき点を抜粋しておきましたので、ご一読頂くと良いかと思います。

・ユーザーコンテンツの責任: Klingは、ユーザーがアップロードまたは公開したコンテンツが適用される法律、規制、およびKlingの利用規約に準拠していることを確認する責任をユーザーが負うことを強調しています。
Klingにアップロードしたコンテンツが、第三者の権利を侵害したり、違法なものでないことを確認する必要があります。

・ユーザーコンテンツの使用許諾: Klingは、ユーザー生成コンテンツを非専有かつ非機密とみなし、Kling AIの提供と改善のために使用できるライセンスをユーザーに付与しています。
具体的には、ユーザーは、アップロードしたコンテンツをKlingがサービスの運用期間中および事業の地理的範囲内で、様々な方法で使用することを許可することになります。

・ユーザーコンテンツの公開範囲: Kling AI の設定を通じて、コンテンツの利用範囲(他のすべてのユーザー、選択したユーザー、または自分だけに公開するかどうか)を決定および/または制御できます。自分のコンテンツを誰が見ることができるかを設定で確認し、プライバシーを守りましょう。

9.まとめ

今回は中国版Sora、至高の動画生成AIの一つであるKling AIについてご紹介しました。
まだテスト版ではありますが、Luma AIのように高品質なImage To Video機能を持ちながら、Runway Gen3に並ぶかそれ以上のプロンプト再現性を持った、ハイクオリティなサービスだと感じました。

今後のアップデートが非常に楽しみです!

2024年の夏は動画生成AIの進化が目まぐるしく、新しいサービスや技術が発表されています。このKlingの全世界公開はその中でも特に注目のニュースと言えるでしょう。

10.AI-Bridge Lab について

AIを使った課題解決や業務効率化に興味のある方は、ぜひAI-Bridge Lab.までご相談ください。経験豊富なコンサルタントが、御社の状況に合わせたAI活用をご提案させていただきます。お問い合わせ、お待ちしております!

ご依頼等は以下のメールアドレスまでお気軽にお問い合わせください。

ai_business@doerstokyo.jp

気に入っていただけたら、Xのフォローもぜひお願いいたします!


皆さまの温かいサポートのおかげで、活動を続けることができています。もしよろしければ、引き続き支援をお願いできますと幸いです。より質の高い記事投稿に励みます!