テキストからビデオ生成ができるオープンソースモデル「CogVideo」を試してみる
CogVideoとは
CogVideoはtext to videoの新しいオープンソースモデルです。比較的高いフレーム レートのビデオを生成できるというのも売りのようでした。
いままでtext to videoはStable Video Diffusionとかなど試してみたことがありましたが、今回はどうでしょうか。とても楽しみです!
🌐プロジェクトページ類
💪試してみる
簡単なプロンプトを強化してくれるボタンもあって親切感満載✨
たとえば「可愛い白猫ちゃんが部屋で遊んでいる」と入れておくと、
こんなに情景をリアルにしてくれる。
せっかくなのでそのままジェネレート。
ふわふわの白猫ちゃん!かわいい〜🐱 動きもちゃんと猫です!
お次は人間で👤
スノーボードをする女性を生成してもらいます。
うん、ちゃんとボードを滑ってますね!よきよき!
このあとは試したものを順次gifで載せていきます。
👀まとめ
生成の精度はどんどん良くなっていきますね。このような高性能なモデルをオープンソースで公開とはふとっぱらです💡
なお、CogVideoはvideo to videoもサポートをされているようです。
精度をどんどん高めていくこともできると思うので、試行錯誤のしがいがありますね!
今日はここまで〜!!
この記事が気に入ったらサポートをしてみませんか?