見出し画像

ChatGPTでAI VTuber作ってみた

日頃から音声配信をしていたある日、「めんどくさいから自動化したい」という気持ちになってしまいました。ファンリスナーよ、ごめぬ。
そこで、話題にものっかり、ChatGPTの言語モデル「GPT3.5」を搭載した自動化VTuberを作ろうと思いました。


AI VTuber v1

早速、↓こちらがアウトプットです

YouTubeライブでAIが視聴者コメントを拾って、自分で考えて返信してくれる状態です。ライブ開始したら後は全自動です。コメントはOBSで管理。

手順は下記(詳細はこちらの記事をご参照)
・AIはmeboで作成 ※言語モデルはChatGPT相当のGPT-3.5も搭載可
・音声読み上げはVOICEVOX
・API色々繋げて配信開始

AI VTuber v2

全体的にデザインを整えたのが↓こちら

アニメーションはJavaScript、全体デザインはCSSです。
ちなみに、右に位置するVTuberのイラストは「nijijourney」で作成しました。

VTuber業界にいたこともあるので思ったのですが、本来絵師さんとかに高単価で発注しないといけなかったものが、無料ツールでプロンプト打ち込んだら生成できちゃうので、すごい時代だなと痛感。

いろんなイラスト系AIを試してますが、「nijijourney」は日本のアニメっぽいイラストが期待値通り出やすい印象だったので良かったです。
ただし、無料利用だと商用利用できない点は注意。

作ってみた感想①:配信活動は自動化できても結局自分でも続けたいとなる

作ってみた結果、どんなに自動化してラクになっても「音声配信はやっぱり自分で喋りたいw」となったので、配信者側の需要、つまり人間の音声コンテンツの供給がAIでなくなることはまだ考えにくいなと思いました。

直近であり得るなら共存、例えば台本や思考のヒントは自然言語にサポートしてもらうなど。僕も、ChatGPTに台本書いてもらって音声配信してます。

作ってみた感想②:価値を持つスキルセットの再定義が起こる

まさに表現と実装の民主化が起きている状態。
呪文(プロンプト)の技術とセンスがコーディングスキルとして価値を持ち、表現と実装がコモディティ化する中で、最終的に「UXデザイン(どうユーザーを楽しませるか)」のスキル価値がさらに高まっていくと思いました。

また、各クリエイティブ素材はAIが生成できるようになってきたものの、全体の編成やディレクションは人間の仕事な気がしたので、意外と動画編集スキルは人間が高め続けた方がいいとも実感。
※今できない人でも、ソフトウェア側の進化で、動画編集の簡略化は進むのでご安心を。

まとめると、
・呪文(プロンプト)
・動画編集
・UX設計
は今後、より重要になっていくスキルな気がした。

作ってみた感想③:「論理的思考」をアウトソース化できる人が価値を持つ

ディープラーニングの得意分野は「推論」なので、人間が今後も論理思考で合理的な解を出すことの価値は相対的に減衰し、人間側は民主化された「表現と実装のツール」でセンスを磨き続けることがかなり必要。

ただし、AIというツールの責任の所在は人間にあり、その人間が関係者への説明責任を常に持つため、彼らを巻き込むための要素(論理性と具体性)を表現するスキルは、基礎能力として引き続き必要。

人間の生み出す合理は「感性→論理→感性」の手順だが(※)、
※感性(具体Aの観察:Aは面白い!)
→論理(抽象思考→要件策定:自身の経験値と、Aの本質と法則性から思考する)
→感性(具体Bへ落とす:Aの法則性からB作った!B面白い!)」

AIが速すぎてこの間の「論理」も学習量で敗北して相対的に価値を持たず、最後の「感性」もクリエイティブ生成とフィードバックが世界同時進行なので一瞬で「古い」に落ちる。時間をかけて研究して、「論理」を経由して「感性」を生み出しても、AIドリブンで進む最先端の「ユーザーの感性」に「僕の論理」が間に合わず通用しない、が起こる。

結果、論理で頑張ることはAIにアウトソース化して、表現と実装を繰り返して「論理」をショートカットして「感性→感性」を磨き続けた人間が勝っていく、そんなゲームチェンジが起きる気もした。

人間の行う論理活動は、説明責任領域の「身の回りの人間を納得させるための論理性と具体性」に留まり、ヒットコンテンツや選ばれ続ける体験を探求する課題解決領域では「感性」ドリブンになる。

つまり、コンテンツや体験設計の「論理」を構築する人よりも、AIのブラックボックスから生まれたアウトプットを「感性」で受け入れて取り入れる勇気を持つ人が、勝ちやすくなる。

余談①:TEDの学習効率も高めてみた

Glaspという拡張機能と組み合わせると「動画からテキストで要約を抽出→翻訳」が可能です。ただ、内容が合っているかの心理的安全性を保ちたいがために、結局英文を一読する自分がいたので、母国語以外を全く勉強しないタイミングは、もう少し先かなと思いました。

余談②:自然言語の原理を自然言語に聞いてみた

まさかの自分アピールで「自然言語」が採用された
傾聴。彼女の機嫌を直す時のように、話が長くても待つ。
「あなたとこれからも付き合いたい」と思った

この記事が気に入ったらサポートをしてみませんか?