【個人的勉強メモ】初の高解像度無料オープンソースAIビデオジェネレーター!The First High Res FREE & Open Source AI Video Generator!
The First High Res FREE & Open Source AI Video Generator!より(GPTにて要約)
このビデオでは、現在最も人気のあるAIの1つであるAIテキストジェネレーションに加え、AI画像生成に関する最新情報が共有され、新しいAIビデオジェネレーター「Potate1」が紹介され、高解像度で非常に有望な映像を生成できると紹介されました。そして、そのオープンソース性が、編集や強化に関する可能性を顕在化させており、非常に興味深い技術であることが確認されました。
Detailed Summary for The First High Res FREE & Open Source AI Video Generator! by Monica
00:00 AIテキスト生成に次いで、AI画像生成が2番目に人気があり、AIビデオ生成が次のステップとなっている。
AIビデオ生成は、GoogleのMind-blowing Imogenビデオなど、すばらしい成果を出しているが、一般に利用できるのはRunway Researches Gen 2のみ。
Runway Researches Gen 2は、テキスト、画像、ビデオクリップから新しいビデオを生成することができるが、一般にはDiscordサーバーを通じてしか利用できない。
しかし、オープンソースのAIビデオジェネレーターが登場し、Runwayに対抗できるようになった。
02:43 高解像度で水印のない動画を生成するオープンソースAIビデオジェネレーターが登場
このオープンソースモデルは誰でもダウンロードし、使用できる
高解像度・高フレームレートのビデオを生成可能
デモ動画では、色鮮やかな3Dアニメーションの果物が空中を飛び交っており、期待できる技術である
05:27 最初の高解像度無料オープンソースAIビデオジェネレーターについての説明
LambdaLabs.comでA100 GPUを使用してトレーニングされたプロトタイプモデルである
テキストからビデオへのファインチューニングモデルが2つあり、高解像度で一貫性がある例がいくつかある
完全に無料で試すことができる、GitHubのリンクとDiscordサーバーがある
08:10 AIによる動画生成の新しいバージョンが登場
モデルスコープビデオを元にしたShutterstockのロゴ、犬、猿、子犬、ロボットの動画が紹介される
犬やロボットなど一部の動画は背景がリアルで、比較的高い連続性を持つ
フレームレートや生成時間の改善前に、連続性を重視する必要がある
10:55 初期段階の技術であるが、1024x576の解像度と24FPSで、Gen 2よりも高い解像度を提供している。
Gen 2の出力は768x448である。
Google collab notebookを開くと、最初に上部の再生ボタンをクリックして、必要なものをインストールする必要がある。
プロンプトを入力し、実行ボタンをクリックすることで、簡単にフレームを生成できる。
生成には時間がかかるが、生成されたものはDiscordサーバーで共有することができる。
13:38 SUMM:
AIビデオジェネレーターの使用には経験が必要であり、ステップ数を減らすことで生成を高速化できるが、1つのステップでは画像が不鮮明になる。
ビデオジェネレーションを高速化するにはステップ数を減らすことができる。
1つのステップでは画像が不鮮明になる。
オープンソースであり、高解像度のビデオ映像を生成することができる。
Gen 2に代わるオルタナティブがある。
この記事が気に入ったらサポートをしてみませんか?