見出し画像

【無料ツールでできちゃう!?】AI画像・イラストを喋らせる動画を作ってみた。

みなさんこんにちは!インター・ラボ株式会社です。
今回の記事では、生成系AIを使って画像・イラストを喋らせる動画製作の過程をご紹介!

今から紹介する方法は、例えば自分が描いたイラスト、生成したAI画像など、オリジナルの作品を簡単に喋らせることができます。
AIやツールについての専門的な知識がなくとも、作りやすくなっています(多分)。みなさんもぜひ挑戦してみてください!

使用したツールと手順

Fotor : 画像生成ツール
https://www.fotor.com/features/ai-image-generator/
D-ID (creative reality studio) : 動画生成ツール
https://studio.d-id.com/
バズ読 : 音声読み上げツール
https://buzzdoku.itl-portal.com/
Canva : 動画編集
https://www.canva.com/

以上4つのツールを使用しました。手順としては、
①FotorでAI画像を生成
②バズ読で喋らせるセリフの読み上げ
③D-IDで画像と音声をアップロードして動画生成
④Canvaで動画編集


画像生成ツール「Fotor」

アメリカ産の画像編集がメインのツール。
  
英語のサイトですが、Googleアカウントを持っていれば簡単にアカウント作成する事ができます。無料アカウントだと5クレジットが付与されます。
画像1枚につき1クレジットが消費されます。

テキストボックス空欄のままで"Generate"と書いてあるボタンを押すと、ダッシュボード画面になります。そのままテキストボックスに欲しい画像のイメージを入力し、Generateボタンを押すでも画像を生成する事が可能ですが、下の画像白枠部分「2images」と初期設定で2枚生成されるようになっているので注意が必要です。意図せず、画像を2枚生成し、クレジットを消費してしまいます…

Fotorダッシュボード画面

ダッシュボード画面では、赤枠の部分がテキストボックス、水色枠の部分が画像のスタイル選択となっています。空欄のテキストボックスをクリックすると、入力テキストのテンプレートや、入力した履歴を見ることができます。英語での入力が難しい方はここの入力テキストのテンプレートから生成してみるのもおすすめです。テキスト入力後、stylesから画像のスタイル、生成枚数を選択したら、オレンジ枠の"Generate"をクリックすると画像生成が始まります。今回は、スタイル「Concept Art」

"pretty woman, delicate features, front view, earrings, concept art, digital painting, illustration, 8k, studio lighting"

というテンプレートを使用して画像を生成してもらいました。

なんとクオリティの高い…

ご覧のように、数秒でクオリティの高い画像が生成されます。
ちなみに、「Jpanese Anime」スタイルで生成すると…

素敵な仕上がりじゃないの…

なんとまぁよい仕上がりだこと…これに声を付けて喋らせることができるなんてすごいやないか…
さて良い画像が生成されたら保存して、次のステップに行きましょう。


音声読み上げツール「バズ読」

次は、バズ読で喋らせるときに使う音声を作成していきます。
テキストボックスに、セリフを入力し、好きな音声を選択、音声作成をクリックでサクッとできます。

ボイスは日本語女性04を選択

日本語音声の試聴ができるので、お試しください。


動画生成ツール「D-ID (creative reality studio)」

D-IDは、イスラエス産の動画生成AIサービス。
画像とテキストを打ち込むだけで、その画像を喋らせてくれるというすごいやつ。D-IDもグーグルアカウントを持っていれば、簡単にアカウント作成できます。

無料アカウントで20クレジットが付与されます。
5分までの動画を作成することができ、15秒で1クレジットが消費されます。


メイン画面。10クレジット残っています。

左側の「+Create Video」をクリックすると、動画作成画面に遷移します。

赤丸の部分、"ADD"をクリックすると自分が描いたイラスト、AI生成画像といった画像をアップロードできます。アップロードした画像以外にもテンプレートから画像を選ぶことができます。
※注意点
顔がうまく認識されないとアップロード不可になってしまいます。
先程Fotorで生成した「Jpanese Anime」スタイルの画像もうまく認識されず…トホホ…

緑枠の部分には、喋ってほしいセリフを入力します。音声も、オレンジ枠をクリックすると、自分で作成、録音した音声をアップロードすることができます。多言語対応で日本語は、女性4種、男性3種の計7種類あります。
音声のスタイルも選ぶことができ、・chat ・customerservice ・cheerfulの三種類。

画像・音声が準備できたら、黄枠の"GENERATE VIEDO"をクリックすると、動画生成が始まります。

こんな感じの動画が生成されます。元の画像が真正面を向いていなかったので、少し違和感があります。正面を向いた画像を使用することをおすすめします!


まとめ

以上生成系ツールを無料の範囲で使用して、AI画像を喋らせることができました。自分で描いたイラストも喋らせることができると考えたらワクワクしますよね!イラストが描けなくとも、イメージやスタイルを入力するだけで、クオリティの高い画像を生成してくれる時代になりました。

これらのツールを使えば、SNS用のショート動画でも面白い、オリジナリティのある動画が製作できるのではないでしょうか?
ぜひ、みなさんも挑戦してみてください!

使用したツール
Fotor : 画像生成ツール
https://www.fotor.com/features/ai-image-generator/
D-ID (creative reality studio) : 動画生成ツール
https://studio.d-id.com/
バズ読 : 音声読み上げツール
https://buzzdoku.itl-portal.com/
Canva : 動画編集
https://www.canva.com/

この記事が参加している募集

企業のnote

with note pro

AIとやってみた

この記事が気に入ったらサポートをしてみませんか?