Vrewを使って3分で動画を作ってみた
「かけAI実験室」へ、ようこそ。きょうは超活字系ライターが生成AIを使って映像作成ができてしまうか、実験します。
これまで映像編集に挑戦したかったけど、動画編集はめんどくさい、難しいってイメージがあった人も多いのではなないでしょうか。私もその一人。一応、シナリオライターなので自分でDaVinci Resolve(ダヴィンチリゾルブ)はパソコンに入れてますし、AdobeのPremiere Proの使い方だってざっくりとは知ってます。でも、画面の見方が難しかったり、よくわららない単語が出てきたりで正直、苦手。そんな機械オンチで文章一辺倒のライターでも簡単に映像作成ができるのがVREW(ブリュー)なのです。
Vrewは人工知能を活用して動画の音声を分析し、自動で文字(テキスト)に変換してくれるソフト。ふつうは映像を作成してからテロップを打ち込んでいくのですが、Vrewで編集するとテロップを自動で付けてくれるので、文字情報が多い動画を編集する人にはとっても便利なソフトです。また、動画編集を映像ベースでなく、文字ベースでできるので、映像センスの無い私のようなライターでも「文字編集」の技術さえあれば映像をつなぐことができてしまいます。何より機能が集約されているので、余計なよく分からないボタンが無いのがいい。
本来は編集ソフトなのですが、私はもっぱら「文字おこしソフト」として使っていました。他の文字おこしソフトもいろいろ使ってみましたが、Vrewは操作が分かりやすく、日本語の聞き取り精度が比較的高い気がします。フレームごとに分割して文字おこしをしてくれるのでいちいち自分で音声(映像)をストップする必要が無いのも便利です。なんとなくの実感ですが、VREWを使ったおかげで作業時間が3分の1ぐらいに減らすことができています。そして、何より60分までの文字おこし(動画読み取り時間)は無料で使えるのが嬉しい。(2023年8月現在)
そんなVrewからある日、こんなメッセージが届きました。「生成AIを使ってテキストから画像編集をしてみませんか?」(←こんなメッセージだったように思う)
「してみたい!」と思わず、声を出して言いましたよ。ちょうど生成AIを使った動画作成にチャレンジしようと思ってたところだったもので。動画生成AIとしてはRunwayのGen2が有名ですが、文字おこしで使い慣れているVREWなら、勝手もある程度は分かってるので、始めやすいというのもありましたしね。
さっそく、動画作成をするにあたり、今回はランサーズに載せるためのポートフォリオを動画で作成することにしました。まずは、PRのための原稿を作成。これはある程度、今まで使っていたものがあるので、軽くアレンジしてこんな文章を作ってみました。
文章作成が苦手なら、この段階からChatGPTにお手伝いしてもらう方法もあると思います。また、VREWにもある程度文章作成をサポートしてくれる生成AIも搭載されているようですから、そちらを使ってみるのもいいでしょう。が、今回は自分で作った文章を使うことにします。
最初に「動画の台本を入力してください」と指示が出るので、上の文章をコピペでピッ。画像サイズをYoutube(16:9)を選んで「次へ」を押します。
次に「台本を読み上げる声優を選択してください」と出てきます。今回は落ち着いた男性の声の方がいいなと思ったので「碧斗」さんを選択。
すると、「台本に合うイメージを作成しています」と表示され、3分ほど待つと約90秒の動画が完成。な、何と便利な。
ほぼ、そのままでも使えるレベルでしたが、他の人に見せるなら次の作業はした方がいいでしょう。
1.テロップを見やすく改行する
そのままだと行が文の途中で改行されているので、読みづらいです。文節ごとに改行を入れ、二行にして見やすくするとより良くなるでしょう。
2.一部画像を置き換える
やはり、イメージと違う画像を出してくることもあるので、写真や映像素材は少し修正を加えた方がいいです。画像を選択し、「置き換える」ボタンを押せば、AIが勝手に置き換える候補を探してくれるので、難しくはありません。候補を探すのに少し時間がかかり気味なのが難点かな。
3.オリジナルの素材を部分的に挿入
自分自身で用意した写真素材があるなら、それを挿入すればぐっとオリジナル感が上がります。私の場合は本人の似顔絵イラストと台本のイメージ画像を追加してみました。
4.必要に応じてクリップを分割
一か所だけ、クリップ(同じカット)が長いところがあったので、分割しました。その作業も文字の上にカーソルを持ってきて、エンターキーを押すだけなので他の編集ソフトに比べると、超楽です!
5.冒頭と最後にクリップを追加
そのままだと唐突に始まり、唐突に終わる感じがあります。句読点などを挿入して、余韻を持たせようとしたのですが、それはできなかったです。結果クリップを追加(クリップとクリップの間にカーソルを置くと、ボタンが出てきます)して「無音」の部分を冒頭と最後に挿入。こうして完成した動画が以下になります。
整え作業を含めて、かかった時間は一時間弱。調整無しでそのままアップするなら本当に3分で動画作成ができてしまいます。
実験結果
VREWを使ってテキストから動画を作ると、簡単に「それっぽい映像」が出来上がります。現状、5分までの動画なら自動生成してくれるので、画像編集者の手を借りるまでもない簡単な作業ならライターだけでも完結可能でしょう。
ただ、きれいに仕上げたいとか、テロップ表記で遊びたい、イントネーションを調整したいなどの「ていねいさ」や「独創」を求めるならば、まだまだ人の力を借りないといけない感じかな、と思いました。
活用法としては台本作成のオプションとして、「こんなイメージで完成しますよ」という映像をお客様に見せてあげるのもいいかもしれません。家を建てる時に小さい模型を作って、イメージしてもらう感じですね。
お見せした結果、「これで十分」と思う人もいるだろうし、やっぱもっと「演出に凝りたい」と思われる方もいるでしょう。それぞれの用途・予算に合わせ、提案できるようになるので、より幅広い受注獲得のチャンスになると考えています。