最近、新たなAI動画生成ツール「Dream Machine」が登場し、その性能が非常に高いと話題になっています。このツールは画像をアップロードし、プロンプトを入力することで2つの動画を生成します。Dream Machineは生成中にショットを変えることがあり、非常に面白い結果を生み出します。また、中国の「Kling」というAI動画ツールも紹介されました。これは2分までのAI動画を生成でき、魚やコーヒー、花のタイムラプス、ギターを弾くパンダなどのシミュレーションが非常にリアルです。さらに、Stability AIの新ツール「Stable Audio Open」や、ElevenLabsのサウンドエフェクトツールなども紹介されました。これらはオープンソースで、独自の音声データを使用してトレーニングすることができます。他にも、NetflixのようなAIツール「Showrunner」や、映画制作費削減にAIを利用しようとしているSonyの発表、各種AI映画祭でのAI映画の受け入れなど、多くのAI関連ニュースがありました。
公開日:2024年6月14日
※動画を再生してから読むのがオススメです。
私たちは新しいSoraの競合製品をテストする特別なアクセス権を与えられました。その結果はまったく驚くべきものでした。
今、使える新しい効果音ツールがあります。また、120,000ドル以上の賞金プールを獲得するために知っておく必要があるいくつかのコンテストがあります。
これが今週のAI映画ニュースです。
まず、非常に本物のSoraの競合他社である新しいAIビデオジェネレータを見てみたいと思います。
これはLuma AIの人々によるもので、ガウス分布とテキストから3Dモデルを作成するスキャンツールを行っている人々が、今度はビデオ生成ゲームに参入し、本当に話題を呼ぶことになるでしょう。
このツールは、画像をアップロードし、プロンプトを入力して、その後ツールから2つのビデオを生成することができるようになっています。
彼らは親切にもCurious Refugeチームにアクセス権を与えてくれましたので、私たちはさまざまなアプリケーションをテストしてみました。
本当に素晴らしいです。
最初にお見せしたいのは、私たちのAI広告コースの講師であるデイブ・クラークが作成したこのトレーラーです。基本的には、彼が作成したいと思っている映画コンセプトであるDismal Swampのために彼がまとめたトレーラーです。
ここでのショットは非常に素晴らしいですね。
クローズアップは、多くのシーンで本当にとても良く見え、リアルな映像から期待される重みや物理シミュレーションを本当に表現しています。
完璧ですか?
いいえ、これはAIビデオであり、ツールを最大限に活用するためにはキュレーションが必要ですが、これらのシーンの多くは非常に興味深く見え、一部は一目見ただけでは、これが人工知能を使用して生成されたものだとは決して思わないでしょう。
このようなツールは、テキストを入力してビデオを生成するだけのツールと比べて、はるかに興味深いものになると思います。
実際のモデルが生成するための参照フレームをアップロードできる能力を持つことは不可欠であり、実際に世界の3D表現を作成するLumaツールのようなツールを使用することは絶対に不可欠です。
以前に生成したいくつかの例をお見せしたいと思います。
このチワワがオオカミに吠えているシーンがありますが、最後になると犬の種類が変わるのがわかります。
子供たちがサッカーをしているシーンもあり、実際に別のシーンに切り替わっているのがわかります。
Lumaでは、ビデオ生成の進行が気に入らない場合、ショットを完全に変更することがあります。
しかし興味深いのは、多くのショットが同じ世界に共存しているように感じることです。
ルマは、環境がどのように見えるべきかの3Dモデルと表現を明確に作成しています。
それは本当に面白いのですが、カメラを異なる場所に変えることさえもします。
また、海で遠くを見つめている男性のショットもあります。
とても良い感じです。
私たちは、好奇心のある避難所で一緒に作成したこのバイキングのコンセプトのいくつかの異なるショットもあります。
世代の品質が本当に本当に良いように見えることがわかります。
このショットは、このバイキングのショットから始まり、その後、別のバイキングキャラクターのショットに切り替えたいと思ったので、本当に興味深いものでした。
彼は実際にかなりクールに見えます。
彼の服装は元の人にかなり似ているように見えます。
でも、何らかの理由で、ルマは時々ショットを変えるのが好きなんです。
ここにはこのエスタブリッシングショットがあり、一見すると本当に良く見えます。
この時点では解像度が完璧ではないと言えるでしょう。
このツールを使用する際には、少しのダンシングや柔らかさが起こることがあるようです。
しかし、オンライン配信や映画のコンセプトには、このツールは本当に素晴らしいと思います。
また、このバイキングの女性のショットもあり、基本的にはそれに沿って追跡されます。
物理学は少しズレているようですが、非常に興味深いです。
ここには、非常にダイナミックなカメラの動きがある2番目のショットもあります。
それは本当に素晴らしいパララックスを伴うトラッキングショットです。
家から出てくるもう1人のバイキングのキャラクターもいます。
かなり素晴らしく見えます。
たくさんの他のクリップをあなたと共有したいと思っています。
このビデオの下にダウンロードリンクを含めましたので、生成したビデオをダウンロードして品質をご自身で確認していただけます。
Dream Machineを使用するには、Dream Machineのウェブサイトにアクセスしてください。
このビデオの下にリンクがあり、[今すぐ試す]ボタンをクリックしてください。
以前の生成物がすべて表示されるこのページが表示されます。
私たちにはこの小さなバグキャラクターがいます。
これらのショットがかなり良く見えることがわかります。
ビデオを作成するためには、ここにある画像アイコンをクリックするだけです。
このSFショットをインポートします。
プロンプトを入力する必要があります。
動きをどのようにしたいかを説明するだけです。
人がポータルに入って歩く、ゆっくりとズームインします。
Enhance Promptボタンが選択されていることを確認してください。
それによって、提示の全体的な品質が向上します。
ツールから望む結果が得られないと判断した場合、数世代後にEnhance Promptボタンをオフにすることができます。
しかし、デフォルト設定では、それはうまく機能する傾向があります。
ここでレンダリングボタンをクリックするだけで済みます。
プッシュするのにわずか1秒かかり、準備が整います。
これらのレンダリングには、時々時間がかかることがあることを注意しておくべきです。
ビデオを生成するために数時間待たなければならない人もいます。
しかし、その品質は本当にとても良いです。
キューに複数のアイテムを追加する能力を持っています。
一度に複数のビデオを作成することができます。
ビデオのためにすべての画像をアップロードしてから結果を確認することをお勧めします。通常、10から15分かかることがわかっていますが、ツールを使用している人数に完全に依存します。
AIビデオジェネレーターについて話している間、中国のClingという会社が開発した非常に興味深いAIビデオツールも紹介したいと思います。
Clingは開催ビッグモデルチームによって開発されたAIビデオツールです。
基本的に、中国の電話番号を持つ人々にウェイトリストを公開しています。
最大2分のAIビデオを生成することができます。
いくつかのシミュレーションは本当にとても良いです。
例えば、この魚のショットがありますし、このコーヒーのショットもかなり良いです。
花が成長するタイムラプスのショットがあります。とてもリアルに見えることがわかります。
パンダがギターを弾くショットもあります。本当に素晴らしいです。
夕日の中のリアビューミラーのショットでは、反射が驚くほどよく映っています。
ビデオを非常にリアルな方法で紹介しています。
最近、多くのAIビデオジェネレーターが登場し始めているのは本当に素晴らしいことだと思います。
より多くの競争は、より良い品質、そして最終的にはあなたが作成できるより良い映画を意味します。
Stability AIは、新しいツールであるStable Audio Openをリリースしました。
基本的に、これは効果音のためのオーディオを生成することができるオープンソースのツールです。
また、独自のオーディオデータでトレーニングする能力もあります。
彼らのウェブサイトにはいくつか素晴らしい例があります。
例えば、私たちはいくつかのシンセサイザー音楽を持っています。
音景を作るのにも最適です。
ここには森で歌ういくつかのカラスがいます。
アコースティックドラムキットでロックビートを持っています。
ElevenLabsのチームも、彼ら独自の効果音ツールをリリースし、現在一般に公開されています。
ElevenLabsの効果音ツールを使用するには、まずElevenLabsのウェブサイトにアクセスし、その後効果音に移動するだけです。
好きなプロンプトを入力するだけです。
私は泥の中を歩く鶏と言って、さあ、効果音を生成するをクリックします。
さあ、結果を聞いてみましょう。
かなり正確だと思いますが、実際には、単にロイヤリティフリーでAI生成されていない効果音ライブラリと比較した場合、どのように聞こえるかに興味があります。
Artlistからいくつかの例と、ElevenLabsから基本的に同じプロンプトの例がありますので、比較して対照したいと思います。
最初のものはフォーカルシャッターです。
最初のものはArtlistからです。
これはElevenLabsのシャッターです。
どちらもリアルな音がします。
馬の鳴き声を再生しましょう。
これはArtlistからです。
これはElevenLabsからです。
実際、ElevenLabsの方が少し良いと思いますが、どちらもリアルに聞こえます。
最後に、雰囲気を作りたいと思いました。
私たちは基本的に忙しいオフィススペースを持っています。
これはArtlistです。
最後に、これはElevenLabsです。
環境を作成する際には、ロイヤリティフリーの効果音を使用することがまだ良い選択肢だと思いますが、特定のユースケースや特定の効果音を探している場合は、ElevenLabsの効果音ツールを使用することも素晴らしい代替手段のように思えます。
また、先週の発表がかなり注目を集めたことがあり、あなたに知っておくべきだと思います。
基本的に、約1年前にSouth Park AI生成エピソードの背後にいる人物であるEd Saciによって作成されたツールがあります。
基本的に、SaciはAIのNetflixのようなツールのコンセプトをまとめました。
基本的に、彼はプロンプトを入力して映画を視聴する能力を持つことを想像しています。
実際には、このツールにアクセスするために約5万人の待ちリストがあります。
実際の機能に関しては、どこにあるかはあまり明確ではありません。
しかし、ウェブサイトに行けば、これらのAIが生成した映画のいくつかの異なる例があります。
ウェブサイトによると、Showrunnerは映画製作者やコンテンツクリエイターがShowrunnerテクノロジーを使用して作成した初のAIテレビ番組です。
Showrunnerによって作成されたいくつかの映画を見ると、確かにリグされたアフターエフェクトタイプの映画コンセプトのように見えます。
現時点では本当に見る価値がなく、魅力的ではありません。
しかし、AIが生成した声や台本を持ち、基本的にプロンプトだけから映画をまとめるというアイデアや技術は、現在多くの人々が達成しようとしているコンセプトです。
ウェブサイトでいくつかの映画をご自身でチェックすることができます。
コメントで皆さんのご意見をお聞きしたいです。
映画の中でAIについて話すと、実際にソニーがCEOが生成AIを使って映画制作コストを削減するという発表を行いました。
現在、多くの大手スタジオにとって収益性の高い映画を作ることは大きな課題です。
スタジオは人工知能の活用を検討してコスト削減を図っています。
先週、私たちはトライベッカ映画祭で、実際にAI映画を競技に受け入れ、イベント全体で展示されたという話に出会いました。
トライベッカは、AIが生成した映画を許可する唯一の主要な映画祭ではありません。
ヴェネツィアからカンヌまで、AI映画はほとんどの主要な映画祭で登場しています。
Pika Labsのチームも、最近AIアルゴリズムを更新して、より良いビデオ品質を作成したと述べました。
Pikaについて話している間に、彼らは実際にAIビデオを探求するために8000万ドルの資金調達を行ったことも述べておきます。
先週、AGIが2027年までにほぼ達成されるだろうと主張する記事に出会いました。
それは非常に興味深いと思いました。さまざまなチャートやグラフがあり、4年前にはAIが基本的に幼稚園レベルのテキストプロンプトを作成していたが、今ではスマートな高校生と同等のコンテンツを作成しているという統計が示されていました。
AGIが実際にいつ起こるかはわかりませんが、おそらくこの10年の中に起こる可能性が高いようです。
先週、AppleからたくさんのAI関連の発表がありましたが、最も重要なことは、今年9月からApple製品がデバイス内でAIを実行できるようになるということです。
基本的に、Apple製品を使用している間、自分が送信しているテキストに関する情報を処理し、絵文字を生成したり、ユーザーの生産性を向上させるために、独自のAIアルゴリズムを使用するということです。
しかし、もし地元のAIが理解できない質問をすると、それは他のAIアルゴリズム(ChatGPTなど)に送られて質問に答えることになります。
基本的には、超知能のSiriを作成しています。
OpenAIについて話すと、先週この報告書に出会いました。それによると、アメリカ人の7%が実際に毎日ChatGPTを使用していると言っています。
しかし、この調査から本当に興味深いと思ったのは、実際にChatGPTが何かを知っている人が53%もいるということです。
この調査では、アメリカ人の半分ほどしかChatGPTが何であり、何をするかを実際に知っています。
彼らはまた、4%の人々がAIを使用してビデオを生成したことを述べ、私はそれがかなり低いと思いましたが、これは物語の未来への新しい探求がまさに氷山の一角に過ぎないことを示していると思います。
現時点ではまだニッチなようですが、もちろん、それは非常に速く変化しています。
ChatGPTは無料ユーザー向けにカスタムGPTSをリリースしています。
カスタムGPTSを利用するためには有料の購読者である必要はありません。
独自のカスタムGPTSを作成したい場合は、購読する必要がありますが、OpenAIが大衆に向けて無料でカスタムGPTSを解除することは、ChatGPTを利用したい人々にとって大きな前進です。
先週、Adobeからのニュースもあり、それにより多くの人々がかなり怒っていました。
基本的に、Adobeは利用者が彼らのツールを使用している場合、そのデータをトレーニングに使用する権利を持っているという内容の利用規約を更新しました。
具体的には、彼らは自分たちのアプリ内で作成されたコンテンツを使用、複製、公開表示、配布、変更、派生作品の作成、公開実行、翻訳するための非独占的な世界的なロイヤリティフリーのサブライセンス可能なライセンスを持っていると述べています。
これはAdobe Fireflyを使用して作成したコンテンツではありません。
これは、彼らのツールにアップロードした資産そのものです。
明らかに、NDAの観点からは問題があります。なぜなら、Adobeのツールにアセットをアップロードすると、基本的にそのデータを使ってAIアルゴリズムをトレーニングする権利があると言っているからです。
Udioチームもオーディオプロンプティングを導入しましたが、これは本当に興味深いです。
基本的に、荒い音楽をアップロードすることができ、アップロードした音声に基づいて他のジャンルの音楽を生成することができます。
簡単な例を見てみましょう。
スリップオン、スリップオン。
ちょうど良い感じになります。
スリップオン、スリップオン。
あなたの目が輝いているのが見えます。
あなたはこれが大好きです。
これは明らかに本当に面白いです。
荒いトラックをアップロードしてから、それを少し磨いたものに生成する能力は、音楽制作プロセスにおいて非常に強力な創造的ツールです。
また、先週私たちを本当に興奮させた未来志向のホワイトペーパーもいくつか見つけました。
最初のものは、基本的には荒いスケッチを取り込んで、それを3Dスケッチに変換するツールです。
かなりクールです。
基本的に、あなたが描いたものを解釈して、それを3D環境に配置します。
彼らのウェブサイトにはかなり興味深い例があります。
例えば、ここにこの帆船があります。
この鳥もあり、画像をアップロードして、その画像から基本的に3Dスケッチを作成する能力もあります。
この特定の用途には多くの実用的な応用があるのでしょうか?
わかりません。
もしかしたら、あなたはこのようなチューンシェーデッドスケッチスタイルのスタイリッシュな映画に取り組んでいるかもしれませんが、スケッチを3Dモデルに変換できる技術が非常に進化していることを見るのは非常に興味深いです。
また、先週見つけたMultiplyというツールがあります。このツールは、キャラクターが含まれているビデオを取り込んで、非常に高解像度の3Dモデルに変換するものです。
その品質は、これまでに見てきた多くの3Dキャラクター置換ツールよりも優れています。
面白いことに、そのデータを3Dアプリケーションに持ち込むことができます。
非常に近い将来、ビデオクリップをアップロードして、わずか数回のクリックでそのビデオクリップから3Dキャラクターを取得できるようになるでしょう。
今週お見せしたい最終のホワイトペーパーは、Vivid Dreamというツールです。
基本的に、画像をアップロードして、その画像をアニメーション化するだけでなく、3D空間で周囲を見渡すこともできます。
あなたが移動できる世界の3Dモデルを作成します。
多くのAIビデオツールが、実際に3Dワールドを作成するこのスタイルのビデオ生成を使用しているようです。これは、基本的に入力画像から始まり、ノイズを追加してそこからアニメーション化する拡散モデルとは異なります。
また、知っておく必要があるAI映画コンペティションもいくつかあります。
最初は私たちのAIトレーラー競技会です。
実際、その競技会の応募プロセスを終了し、審査員が応募作品を見ています。
ほぼ400件の応募があり、ただ1人の優勝者を選ぶのは非常に難しいですが、その競技会の優勝者を近々発表します。
また、ヴェネツィア国際映画祭と同時に開催される新しいAI映画祭も発表しました。
この競技会はReplyとMastercardとの共同主催で行われ、基本的にファイナリストはヴェネツィア国際映画祭中にヴェネツィアに招待され、優勝者には8,000ユーロが贈られます。
カテゴリーをご覧いただけます。
この動画の下のリンクをクリックすることで、4つの異なるカテゴリーに入ることができます。
シェルビーと私は、このイベントの審査員を務めます。
あなたが作成する映画を楽しみにしており、ヴェネツィアでお会いできることを楽しみにしています。
また、パリのMK2とのコンペティションがあり、AI映画に10,000ユーロが贈られ、MK2ビブリオテークでパリで初演される予定ですので、そのコンペティションに関する詳細は以下でご確認いただけます。
私たちはまた、Sunoが実際に6月に彼らのプラットフォームで生成されたトップ500の曲に10万ドルを提供していることを知りました。ですので、もし曲を生成してそれが本当に人々に共感するなら、最大1万ドルを獲得するチャンスがあります。
それでは、今週のAI映画に移ります。
最初に紹介したい映画は、Ike Weiによる「Loose Ends」という作品です。
Ikeは実際にCurious Refugeのコミュニティマネージャーであり、非常に良いストーリーテリング、素晴らしいサウンドデザイン、そして非常に説得力のあるキャラクターの置き換えを披露した素晴らしい映画を制作しました。
次にハイライトしたい映画は、FramestoreのVFXアーティストであるWilliam Bartlettによって制作されました。
基本的に、これは世界への賛歌であり、人間が環境に与える影響を表現しています。
非常に興味深い3Dショットや、これまでに見た中で最高のAIビデオ生成が含まれています。
最後に、先週新しい話を見つけましたが、それは基本的にAIがバイリンガルの脳卒中患者がコミュニケーションを取るのを助けるために使用されていると言っていました。
脳卒中を起こすと、言語を処理する脳の部分が混乱することがあり、バイリンガルの場合、複数の言語を混同することがあります。
基本的に、科学者はAIを使用して、彼らが何を言おうとしているかを判断し、より効果的にコミュニケーションを取ることができるようにしています。
AI映画ニュースのこのエピソードをご覧いただき、ありがとうございます。
AI映画ニュースを直接メールで受け取りたい場合は、CuriousRefuge.comで購読することができます。