見出し画像

中国生成AIの凄まじい進化!

こんにちは、AIの進化に心躍らせる中村です。今回は中国のショート動画共有プラットフォーム「快手(Kuaishou)」が開発した最新の動画生成AI「可灵(Kling)」についてご紹介します。AI技術の発展が動画生成の世界にも革新をもたらし、未来の映像制作に大きな変化をもたらしています。

画期的な動画生成AI「可灵(Kling)」

快手が開発した「可灵(Kling)」は、テキストから最大2分間のフルHD動画を生成する能力を持つ革新的な動画生成モデルです。このモデルは、快手自らが開発した大規模視覚言語モデル(LVLM)に基づいており、効率的なトレーニングインフラと推論最適化技術を駆使しています。

運転する猫

Klingの特徴は、時間と空間を組み合わせた独自のアテンションメカニズムにあります。これにより、複雑な時空間の動きを精密にモデル化し、物理法則に従ったダイナミックな動画を生成することが可能です。例えば、「白い猫が車を運転して、賑やかな市街地の道を通ります。背景には高層ビルや行き交う人々が見えます」といったプロンプトで生成された動画は、現実と見間違うほどのクオリティです。

SORAのクオリティもすごいです

OpenAIの「Sora」との競争

快手のKlingは、OpenAIが発表したもののまだ一般公開されていない動画生成モデル「Sora」を意識していることは明白です。Soraが動画生成の未来を切り開こうとしている中、Klingの登場はその対抗馬として注目を集めています。OpenAIのSoraがどのような機能を持ち、どのように進化していくのか、今後の展開が非常に楽しみです。

利用には中国の電話番号が必要

Klingを利用するには、快手の動画共有アプリ「快影(Kwai)」をダウンロードし、AI映像生成機能を申請する必要があります。残念ながら、現時点では中国の電話番号が必要となるため、国内からの利用は少しハードルが高いかもしれません。しかし、この技術が広く普及する日も遠くはないでしょう。

ラーメンを食べるおじさんのクオリティの高いこと!

AI動画生成の未来

動画生成AIの進化は目覚ましく、今後も多くの分野で応用されることが期待されます。AIが生成する動画は、プロンプトを書くだけで簡単に作成できるようになり、クリエイティブな仕事の効率を大幅に向上させるでしょう。もちろん、AI技術にはまだ改善の余地がありますが、私たちの生活や仕事に新しい可能性をもたらしてくれることは間違いありません。

ただ長尺の動画に関してはクオリティが高かったとしても、使い勝手がかなり難しいと想像しています。なぜならば画像生成AIであったとしても狙った画像を生成することは困難だからです。画像であれば素早く作成し素早く確認出来ますが、長尺動画となると作成時間も掛かる上に、確認にもかなりの時間を要するでしょう
それを考えると動画作成のプロは使えど一般的にはエンタメ的な使用にとどまるのではないかなぁと想像しています
なにはともあれ使える日が楽しみですね^^

以上、今回はKlingとその技術的背景についてご紹介しました。AI技術の進化を見守りつつ、これからのクリエイティブな未来に期待しましょう。それでは、次回の投稿もお楽しみに!

こちらはMidjourneyで作成!


この記事が気に入ったらサポートをしてみませんか?