見出し画像

<実験>ホラーコンテンツをAI生成『喋るTHISMANの召喚』AI・ローファイダビング

まずタイトルの完成動画がこちら

初めて挑戦したホラー動画にしては、まあまあの出来ではないでしょうか 😤 フンス
以下、作り方のレポートです


<逆説> 生成AIが未成熟な今こそホラー

2024年冒頭の現在、生成AIはコンテンツ制作の利用において夜明け前の状態、従来の方法で作った方がぜんっぜん早いです

  • 人間の演出意図を反映しにくい

  • 感情、コンテクストを表現しにくい

  • 動きがぎこちなく不自然

  • 学習データからイレギュラーな要素が入り込む

  • 同一性の保持が難しい

<だがしかし>
「キモさ、不自然さ」が価値になるホラー系なら、これらのデメリットが良い感じに働く事があるのでは?と思い立ち

パパっと実験してみました


<実験>"THIS MAN"さんをAI召喚

オリジナルキャラを作っても良いんですが、ここはあえてミームとしてこすられまくっている「THIS MAN」で新味を出せないか実験してみます
(THIS MANを知らない人は→こちら

出典:https://www.thisman.org/portrait/

<前半戦>AIアバターサービスでホラートーク

人物の静止画一枚と、テキスト/発話音声データを用意すれば、自動で口パクして顔の動きまで生成してくれる「HeyGen」「Creative Reality」等のデジタルアバター生成サービスが話題です

「スゴイ!!」→「でもこれ何に使えるの??」という技術がまだ多い中、ビジネス等での実用性が高く、2024年注目株の生成AIサービスです

これを無駄遣いしてTHIS MANさんを喋らせます

本来はAIコンシェルジュ等に使う技術

現状、イラストを喋らせるのはほぼ破綻しますが、人間の写真に近い絵であれば成功率↑高↑です(実用化済みの顔認識技術がベースになっているっぽい)

予備実験でお布施しまくって成否の境界ラインは見えているので「たぶん行けるだろう」と判断して進めます


▼ 【STEP-1】まずGPT4で台本を生成

LLMを使った創作の基本「促して続きを書かせる方式(few-shot)」で生成します

さすがAI
古いネットミームには
詳しいですね

ここ一年でGPTは相当賢くなりました

でも一方でクリエイティビティがすっかり Nerfされてしまっているので、「恐怖」を増そうと具体的な指示をすればするほど、予定調和なテキストが出てしまいます

語るほどに益々つまらなくなる優等生

プロンプトエンジニアリングでしつこく自動生成を追求するのもありなのですが「怖さとは何か」という深遠な別テーマに引きずり込まれるので今回はパスする事にします

一番最初にラフにぶん投げてパパっと生成したセリフを採用、あとは制作しながらアジャイルに調整で行きましょう


▼ 【STEP-2】セリフ読みテスト

さっそくCreative Reality でテキストから生成した一発目がこちら↓

教育番組かな

ぜんぜん怖くないですね
さてどうするか

<原因の仮説と対策>

  • セリフが説明的→人力で口語に調整

  • 発声が明瞭すぎる→日本語話者のモデルから英語話者のモデルに変更

アジャイルに調整した二発目がこちら↓


少し不気味さが出てきました

やはり不自然さを利用してホラーするという基本方針は合っていそうです


▼ 【STEP-3】AI・ローファイダビング|最新音声AIで発声を不気味に劣化

先日のシリーズB調達でいよいよユニコーン企業になった音声AIサービスのEleven Labsがこちら ↓

8000万ドル調達したとは思えない質実剛健なトップページ

トーク動画を一発で多国語化してしまう驚異のテクノロジー「Dubbing」という機能、こいつの弱点を不自然さの生成に利用します

Eleven Labsの言語変換機能「Dubbing」


みんなが驚くこの超機能ですが、日本語→英語→日本語とダビングを繰り返すと、かつてのカセット/VHSなどの磁気テープメディアのように、喋りが劣化していきます

この劣化を意図的に激しく起こして、しつこく繰り返すことでおどろおどろしさの生成に挑戦します
名付けて「AI・ローファイダビング

延々と入出力ファイルが増えていきます

自分の行為自体が少しホラーじみて来た


そして最終的に出来たのがこちら

やった~、だいぶホラー👻な感じになりました
これで完成
(ホラー系クリエイターの知人にも褒められました)
































.
.
.
.
.






実験後の数日間、しつこく頭の中のTHIS MANが問いかけてきます

おいpsymen




お前のホラーはその程度なのか?




おい、聞いているのか?











なあ



うるせー!
(これがTHIS MANの呪縛なのか)

実験の基本コンセプト「AIの生成結果からパパっとチェリーピッキングするだけ」から外れますが「AIでパパっとしゃべるTHIS MAN(AIスゲエ!)」の先を見たくなってしまった自分がいます禁断のAfterEffectsを立ち上げ、ここからはAIを利用しつつも自ら意図的に「ホラー演出」を加える冥府魔道に分け入る事に・・・


<後半戦>もっとホラーな目にあわせてやる!


▼【STEP-4】顔のゆらぎパターンを生成

Leonardo.AITHIS MANの変異体をどんどん生成するのだ!

モデルが多いからパターンをパパっと出しやすいだろう?


▼【STEP-5】そのパターンたちも喋らせる

CreativeRealityでアバター動画のクローンを大量に生み落とせ・・・

THIS MAN パーティだ!


▼【STEP-6】実験室で秘密の錬金術

だが・・・
このままでは「喋る生首」止まりだ

AfterEffects上で3Dレイヤー化して不安定なモーションを追加してやれ!(ChatGPTにエクスプレッションの式を書かせたりすると、きっと作業がはかどるだろう・・・)

結局お前はAdobeをガッツリと使う事になるのだ


▼【STEP-7】ホラーなV2V生成をチェリーピッキング

そしてその出力動画をおもむろに、誰も知らないAIサービスkaiberAIのVideo to Video機能につっこめ!

ドーン!
ギャ~ッ!!


▼ STEP-8 完成

STEP-6と7をしつこく繰り返して、完成だ!


<振り返り>

  • カオス生成装置として生成AIを使う

  • 未経験でも審美眼があれば作る側になれる

  • デジタルアバター ✕ 多言語化まわりがヤバい

▼カオス生成装置として生成AIを使う
制作の場面において「いい感じのランダムな状態」を実装するのは試行錯誤が必要で、エクスプレッションを使ったり、結局手付けでアニメーションしたりと、思いの外時間が溶けていくことが多いです
今回は方法論を試行錯誤したので時間がかかりましたが、単純な作業時間だけで見ると大幅に効率化できそうな感触がありました

▼未経験でも審美眼があれば作る側になれる
オカルトや超常現象コンテンツは子供のころからそこそこ親しんでいて、ユーザーとして採点辛めな方なのですが、クリエイターとしてはこっち系のコンテンツは作った事がありませんでした
生成AIの可能性への仮説「審美眼があれば作る側になれる」を体感できた気がしました

▼デジタルアバター 多言語化まわりがヤバい
数日間触っているうちに、Eleven LabsのDubbing機能がアップデート、自動翻訳変換が劣化する事象に対して手動で修正できる機能がついちゃいまして、これも逆利用する事で更におどろおどろしい喋り方を実現できました

まさに爆速開発を目の当たりにして、ホットな分野である事を実感しましたね
今年ビジネスするならこのアバター領域なのかも!


以上、現場からでした!お疲れ様っす~



↓ 誰も知らない生成AI「Kaiber AI」の過去記事はこちら


↓ちゃんとしたElevenLabsの記事はこちら



X(Twitter)で
AIニュースをポストしています
フォロー頂けると嬉しいです!


いいなと思ったら応援しよう!

この記事が参加している募集