Soraが使えるようになるまでに動画生成AIにも触れておきたい。そう思ったので、試しにStable Video Diffusionを触ってみました。
この記事では、Stable Video Diffusionの始め方を説明いたします。
Stable Video Diffusionとは?
とりあえずAIに聞いてみました。
Stable Video Diffusionの始め方
まずは下記サイトにアクセスします。
「Continue with Google」で、Googleアカウントを利用してログインが可能です。
利用規約への同意を求められますので、チェックして「I agree」を押します。
翻訳内容はこちら
ログインできたら「Start with Image」または「Start with Text」をクリック
(次の画面へ移動しても変更できるので、どちらを選んでもOKです)
「Start with Image」の場合
「Select an image」をクリックして画像を選ぶか、ドラッグ&ドロップで画像をアップロードします。
今回は、こちらの画像をアップロードしてみました。
画像のアップロードが完了したら「Camera Motion」から動画の動きを設定して、「Generate」をクリックすると動画の生成が開始されます。
「More will be enabled soon!」と記載があるので、選択できない設定項目は今後のアップデートで追加予定でしょうかね。
各Camera Motionの内容をChatGPTに解説してもらいました。
今回は、Panだけ設定してみました。
生成された動画はこちら
さすがに画像に写ってない部分の背景は綺麗に生成されないですね。
「Start with Text」の場合
「Describe your image.」と書かれた部分に動画生成のための指示(プロンプト)を入力します。
「Style: None」と書かれたボタンをクリックすると動画のスタイルを選択できます。
動画のスタイルは全部で18種類から選べます(Noneを含む)
今回はChatGPTに提案してもらった下記プロンプトで動画生成を試してみました。
動画スタイルは「Photographic」にしました。
テキストのプロンプトを入れると、画像が4枚表示されます。
この中から気に入った画像を選択して、その画像を起点とした動画を生成してくれます。
画像を選択し、「Start with Image」の時と同様に「Camera Motion」の設定を行います。
Camera Motionの設定が終わったら「Proceed(進む)」をクリックして、動画の生成を開始します。
今回は、Camera Motionの設定を何も行わずに動画を生成してみました。
生成された動画はこちら
プロンプトで細かく動きを付けさせようとすると崩壊しますね。単に指示の内容が悪いだけかもしれないですけど。
すごくシンプルなプロンプトでもう一回チャレンジ
このシンプルなプロンプトを試してみましたが、これでも崩壊しました。
ちょっと怖かったので動画は載せないことにします。
上手いこと動画を作ってもらうのって難しいですね。
とりあえずStable Video Diffusionを触れる状態には出来たので、また時間があるときに試してみないとですね。
今回の記事は以上になります。
もし今回の記事が参考になったという方いらっしゃったら、
フォローやスキ♡もしていただけると嬉しいです。