【動画生成AI】最高品質のAI動画が作れるKling AIの実力
👋こんにちは!AI-Bridge Labのこばです!
今回は、高度な物理シミュレーションを搭載したAI動画サービスKling AIについてご紹介します!
Klingを使うと、プロンプトや静止画から以下のような動画を簡単に作ることができます
映像を見ていただくと元画像ではアングル的に見えていない部分があっても、立体的に補完してくれているのがわかりますね!
以前から、中国の電話番号を取得済みの方は利用ができていたのですが、この度メールアドレスを登録すればだれでも使えるようになりました。
Klingの概要や使い方、他の動画生成AIとの比較、今後のアップデート予定などについて分かりやすく解説します!
1.Kling(クリング)とは?
Kling(クリング)は、中国の快手科技有限公司(クアイショウ)によって開発された動画生成AIです。現在は5秒の動画をテキストや画像から生成でき、自然な動きとリアルな映像を実現します。
2.Klingの特徴
高解像度:1080pの高解像度でレンダリングします。
物理シミュレーション:リアルな物理シミュレーションを搭載し、現実世界の物理法則に従った映像表現を実現します。
3Dフェイス/ボディ再構築:一枚の全身写真から完全な表情と四肢の動きを制御します。
ネガティブプロンプトの指定:動画として出したくない否定的要素を指定することでより良い結果を得る可能性を高めます
3.Klingの機能
AI Image:プロンプトをもとに画像を生成
画像をアップロードしてスタイルを参照することもできます
AI Video:テキストから動画を生成
静止画像の5秒動画への変換:AI Videoの機能で静止画像を5秒の動画に変換することができます。
4.Klingの基本的な使い方
1.Klingのウェブサイト(https://klingai.com/)にアクセスし、登録手順に従ってアカウントを作成します。
メールアドレスとパスワードを登録すれば認証コード付きのメールが届きますので、そのコードを入力フォームに入れてログインします。
2.ログイン後、ダッシュボードからAI Videoを選び、「Text to Video」または「Image to Video」を選択します。
3.テキストプロンプトを入力するか、画像をアップロードして動画を生成します。今回はテストとして、テキストのみで「日本の侍がファーストフード店に座ってハンバーガーを食べています。カメラは固定されています。テーブルの上にはコーラが置いてあります。」という文章を英語にして入力してみます
▼ネガティブプロンプトは以下を指定
blur, distortion, disfigurement, low quality, collage, grainy, logos, abstract, illustrations, computer-generated, warped
4.生成された動画を確認します。
現時点ではまだ課金プランが準備中のためウォーターマーク(右下のロゴ)が記載された状態になりますが、自由に動画をダウンロードすることができます。
5.今後のアップデート予定
Kling AIはまだテスト版ですが、既に今後実装予定の機能をいくつか確認することができます。それらを以下にご紹介します!
5-1.Settingセクション
・High Qualityモード
ビジュアルクオリティの高い動画が生成できるようになるモードが解放予定です。現在は、高速生成のHigh Performanceモードのみ選択可能
・動画の尺
現在は5秒のみ選択可能ですが、10秒の動画生成に対応する予定です
5-2.Image to Videoセクション
・Add End Frames
最終フレームの画像を指定することができます。Luma AIにもある中割り生成(キーフレーム)機能ですが、最初と最後の原画が必要になりますが、これがあると狙った映像を作りやすくなります。
5-3.出力結果セクション
・Extend機能
生成した動画を+5秒延長します。
現時点ではこの機能がないので、延長するためのテクニックとして「GPT-4oなどに動画を渡して最終フレームを抽出してもらい、それを最初のフレームとしてimage to videoし直す」という方法で延長することができます。
ただ、この方法だと動画のコンテキスト(文脈)が保持されないので、クオリティ的にはExtend機能で作るほうが良くなるとは思います。
6.他の動画生成AIとの比較
現時点で、ハイクオリティなimage to videoが可能なLuma AI、テキストから最高品質の生成できるRunway Gen3と比較しました。
画像(+テキスト)から動画を生成するパターンで、Luma AIのDream Machineと比較しました
Lumaもすごいのですが、Klingの方が破綻なく大きく動いているにも関わらず自然な見た目です。LumaとKlingの大きな違いは、物理シミュレーションの精度の高さと推測しています。
テキストから動画を生成するパターンで、Runway Gen3-alphaと比較しました
Runway Gen3はアジア系の要素を生成するのが苦手ですが、動画の品質や動きの自然さはKlingを凌いでいると思います。
逆に、Klingは少し品質が劣るものの、プロンプトを忠実に再現し作りたい動画が作れています。
7.アニメ系の動画について
いくつかアニメ系のimage to Videoについても試してみたのですが、ある程度問題なく動いてくれました。実写系に比べると動きの違和感は少しあります。
まだ大量には試せていないですがLuma AIよりも精度や成功率は高そうです。
8.利用規約およびプライバシーについて
Klingの利用規約とプライバシーポリシーは以下のページから確認できます。
利用するユーザーが注意しておくべき点を抜粋しておきましたので、ご一読頂くと良いかと思います。
9.まとめ
今回は中国版Sora、至高の動画生成AIの一つであるKling AIについてご紹介しました。
まだテスト版ではありますが、Luma AIのように高品質なImage To Video機能を持ちながら、Runway Gen3に並ぶかそれ以上のプロンプト再現性を持った、ハイクオリティなサービスだと感じました。
今後のアップデートが非常に楽しみです!
2024年の夏は動画生成AIの進化が目まぐるしく、新しいサービスや技術が発表されています。このKlingの全世界公開はその中でも特に注目のニュースと言えるでしょう。
10.AI-Bridge Lab について
AIを使った課題解決や業務効率化に興味のある方は、ぜひAI-Bridge Lab.までご相談ください。経験豊富なコンサルタントが、御社の状況に合わせたAI活用をご提案させていただきます。お問い合わせ、お待ちしております!
ご依頼等は以下のメールアドレスまでお気軽にお問い合わせください。
気に入っていただけたら、Xのフォローもぜひお願いいたします!
皆さまの温かいサポートのおかげで、活動を続けることができています。もしよろしければ、引き続き支援をお願いできますと幸いです。より質の高い記事投稿に励みます!