見出し画像

【Digen AI】一瞬でリアルなショート動画が生成できるツールの使い方解説!

こんにちは、AIBridge Lab のこばです😊 今回は、リアルな動きを持つ動画を生成できる次世代のAIツール「Digen AI」について紹介したいと思います。

Digen AIがどんなものが作れるのか実際に動画を1つ作ってみましたので、一度ご覧ください

いかがでしょうか。かなり自然な発音とリップシンクができています。
日本語では所々アクセントや読み方が変になっているところはありますが、まだ開発途中ということを鑑みれば、かなりの完成度です。

動画はDigen AIから、字幕やBGM等の編集はVeed.ioで行いました。

以下では、Digen AIの特徴や使い方、注意点などをご紹介していきます!


Digenについて

Digen AIは、テキストを入力するだけで、リアルな動きとジェスチャーを持つビデオを自動生成してくれるAIプラットフォームなんです。教育やマーケティング、エンターテインメントなど、さまざまな分野での活用が期待されています。

主な特徴と機能

  1. リアルモーション技術

    • Digen AIは、入力されたテキストをもとに、まるで実在する人物のようなリアルな動きのビデオを生成します。

  2. 多言語対応

    • 複数の言語に対応しているので、グローバルなコミュニケーションツールとしても活躍します。言語の壁を越えて、効果的にメッセージを伝えられるんです。

  3. 簡単な操作

    • テキストを入力するだけで、高品質なビデオが作れるのがDigen AIの魅力。専門的なスキルやチュートリアルがなくても、誰でも簡単に使えます。

  4. 高精度のリップシンク

    • 音声とビデオのリップシンクがとてもリアル。違和感なく自然な映像体験を楽しめます。

主な使用例

  • 教育: 現状は40秒程度ですが、もっと長時間で作れるようになったら教材ビデオの作成やオンライン講義の配信にも使えそうです。

  • 広告:もっと表情豊かで抑揚がつけられるようになったら商品紹介にも本格参入してきそうです。

  • エンターテインメント: SNSでのコンテンツ共有やバーチャルイベントでは編集次第ですでに使えるレベルかもしれません。

Digenの使い方

まずはウェイトリストへの登録が必要です。私の場合は3日ほどで招待メールが届きました。順次解放されているようなので、気になる方はぜひ登録してみてくださいね。

ウェイトリストは下のリンクから登録可能です。

生成機能

  • リアルモーション
    背景込みのリアルなモーション動画を作成できます。
    上で作成した動画もこのリアルモーションで作成しました。作成した動画はMP4や音声ファイルとしてダウンロードしたり、シェアリンクでSNSに投稿したりすることができます。

  • 音楽の生成
    アバター動画を作成する際に、プロンプトを元にBGMを生成することができます。あくまでも動画用のBGMという感じなので、同じフレーズが繰り返されるような楽曲になる確率が高い印象です。

  • アバター動画
    用意されたアバターか、オリジナルのアバターを元に動画を作成することができます。

  • オリジナルアバター
    5分間の自撮り動画を用意できれば、オリジナルアバターを作成することができます。今回はオリジナルアバターについては未検証ですが、クリエイターの方のモーションも提供されているため、品質はかなり良さそうです。

編集機能

  • テキストの追加
    作成する動画に字幕やサインを付けることができます。
    字幕に関しては、この記事を作成しているタイミングでは編集画面にタイムラインが見当たらなかったので、まだ編集機能としてはおそらく未実装?いずれは、字幕も込みの動画が生成できるという布石かもしれません。

  • 背景画像
    背景画像はプリセットで用意されている素材から画像を選んで使用することができます。

実際に使ってみた

リアルモーションの作り方

リアルモーションのタブから、動画として使いたい素材を選択します

声優の選択

右下のボタンからボイスを選択することができます。
日本語に対応したボイスは現時点で7つです。今後増えていくと予想されます。再生ボタンでどんな声か試聴可能です。

テキストの入力

日本語のテキストはおよそ400字以内で入力できます。ChatGPTなどのAIを使って台本を作る際は、その文字数を意識すると良いでしょう。

GPT-4などの言語モデルを使った台本作成機能もありますが、すでにChatGPTなどをご自身で利用している場合は、自分のAIを使うのがおすすめです。クレジットの消費を抑えられますので。

生成のポイント

用意したテキストがどんな風に読み上げられるのか声優の右側にある再生ボタンで再生してみましょう。
すると、読めていない漢字や発音に違和感がある部分を予めチェックすることができます。結局は生成するときにランダムになるのですが、漢字の誤読は本当に多いので、ひらがなやカタカナに変えておくなどしておけば精度はある程度上げられます。

生成

準備ができたら右上の「生成」ボタンを押して動画を作成しましょう。これを押しても消費クレジットなどの確認ダイアログを挟みますので、ボタン押したらすぐに生成ということはありません。

生成中および生成が完了した動画はMy Videoタブに送られます。

現状の問題点

  • 音声が崩れたり、音飛びしたりするアウトプットがたまにある。

    • それでもクレジットは消費されてしまうので、早めの改善が望まれます。

    • 改行やスペース、記号はなるべく使わないなど、テキストは英語フォーマットを意識しましょう。

  • 生成のたびに、台本の読み方や身振り手振りが変わる。

    • 何度か試す必要があり、満足のいく出力を得るハードルがやや高いです。(クレジットの消費もあるので)

    • 日本語の精度は90%程度(特に漢字が苦手)なので、完璧なものを作るには編集技術と情熱が必要ですね。

  • まだ表情が固く、顔に感情がこもっていない印象。

    • この辺りは、テキストの感情分析が適用されていけば、きっと改善されるはずです。

料金体系

無料でも少し触ることができますが、クレジットの補充については言及がないので、いろいろな動画を作ってみたい場合はクリエイタープランに入る必要がありそうです。

月額または年額制で、月額で約10USドルと約80USドルで利用できます。
まだ開発途中のツールということもあり、いろいろ試すにはクリエイタープランで触ってみるというのも良いかと思います。
私はとりあえずクリエイタープランで1ヶ月間触っていくつもりで課金しました。

まとめ

まだ開発途中のツールではありますが、クリエイターの工夫次第では面白いアウトプットも期待でき、とても将来性が感じられました。
GPT-4oのような感情分析や感情表現が備わったら、より自然で高品質なビデオ生成が可能になるでしょう。ぜひDigen AIを試してみて、その可能性を体感してみてくださいね!

ここまで読んでいただき、ありがとうございました😊

AI-Bridge Labについて

私たちAI-Bridge Labは、最先端のAI技術を使って、企業のDXを支援しています。 LLMや画像生成AIを使ったコンテンツ制作や社内でのAI人材育成など、AIを活用したビジネス課題の解決をサポートしています。

もしAIの導入にお悩みの方は、ぜひ一度お問い合わせください。 一緒に、AIを活用した新しいビジネスの可能性を探っていきましょう!

最後まで読んでいただき、ありがとうございました! 😄
スキや、Xアカウントのフォローもぜひお願いします!

いずれ一枚の写真から身振り手振りのあるAIアバターが作れるようになりそうですね

皆さまの温かいサポートのおかげで、活動を続けることができています。もしよろしければ、引き続き支援をお願いできますと幸いです。より質の高い記事投稿に励みます!