見出し画像

【日記#49】「Stable Video Diffusion」試してみた!

やはり、生成AIと言えば日記初日から使っております「Stable Diffusion」だと私は思います。

やっぱこれだねー♪

https://lotte-shop.jp/shop/g/g106774/


その「Stable Diffusion」の動画生成AI版「Stable Video Diffusion」を今回は試して行きます!!!

まずですが、「Stable Video Diffusion」のリンクはこちらです。

今回試すにあたって参考にした記事はこちらです。

この記事に掲載されている「Google Colab」 のNoteBookをドライブに保存して実行すると以下のようになり、Running on public URLをクリックするとWebUIが開きます。

そして、以下の画像を元に動画生成します。

結果はこちらです。

デフォルトの設定のままだと、アスペクト比が変わってしまうのでresize to optimal sizeのチェックを外して再生成します。

その結果がこちらです。

このクオリティで、「Google Colab」L4の場合の生成時間約2分で、

108.9/60 ≒ 1.815m

「Google Colab」のコンピューティングユニットも2つ動画生成して1.21消費と「Animate Anyone」の半分で済みます!

生成前:96.63
生成後:95.42
96.63-95.42 = 1.21

しかし、プロンプトやパラメータでの調整ができず狙ってダンス動画を作るのは難しいようです。
以下のスクショで全ての設定です。

number of frames:動画の総フレーム数(約6フレームレート固定で多い方が動画が長くなります。
(動画時間4秒固定で滑らかになっていくわけではないです。)
number of steps:生成のステップ数(多いほどクオリティが上がるが生成時間が長くなります。)
seed (integer or 'random'):シード値(同じような動画を生成する際に使用します、ランダムにしたい場合は'random')
number of frames decoded at a time:一度に処理されるフレームの数。(マシンスペックが高い場合数値が高い方が早く生成されると考えられます。)

詳細設定について以下の記事を参考にしました。


この生成速度かつこのクオリティでダンス動画を作れるのが理想でしたが、逆にプロンプトやパラメータがないからこそ早く生成できるのかもしれません。

動画生成AIは一長一短で難しいですね…
そのため、これからもどんどん調べて行きます!

それでは次の投稿もお楽しみに!!!


#日記 #note #毎日note #毎日更新 #毎日投稿 #note毎日更新
#動画生成 #生成AI #AI
#StableVideoDiffusion

この記事が気に入ったらサポートをしてみませんか?