記事一覧
VTuberとAITuberを並べて音声対話しながら配信する
実装要件
中の人が居る=VTuber
中の人がAI=AITuber
と、ざっくり解釈して、
2人並べて、音声会話しながら配信してみたい。
ゲーム配信したいので、AIとの音声会話は完全にハンズフリーにする。
使用アプリ/サービス
OBS 配信環境アプリ
Miibo AI会話サービス (ChatGPT API使えるならそれでも良さそう)
ゆかりねっと 音声からテキストに
VMagicMirrorを2つ起動してOBSで映す
VMagicMirrorは普通に2つ起動できるのだが、OBSでWindowをキャプチャーする時、どちらを選んでも片方(おそらく先に起動した方)しか映せない。
推測だが、OBSが実行ファイル名+ウィンドウ名の文字一致で、最初に見つけた方を使っているようだ。
なので、実行ファイル名+ウィンドウ名が全く同じなのはOBSでは扱えない。
じゃあ、VMagicMirror.exeをリネームしよう。
VMag
ThreeDPoseTrackerでトラッキングしたモーションを、VMCProtocolでVSeeFaceに連携する
3teneというソフトでキャラクターにアイドルモーションやリップシンクをさせていましたが、表情も加えたくなりました。しかし、3teneやVMagicMirrorは、外部コマンドから操作するためのVMCProtocolに対応していません。そこで、ThreeDPoseTrackerとVSeeFaceを試してみました。ThreeDPoseTrackerはカメラやムービーから全身をトラッキングしてくれるソ
もっとみるImportError: cannot import name 'get_ref_type' from 'omegaconf._utils' を解決する。
RVC-betaを使うのに、'get_ref_type' のエラーが越えられなかったのでどこかのバージョンからコピペ実装。
def get_ref_type(obj: Any, key: Any = None) -> Optional[Type[Any]]: from omegaconf import DictConfig, ListConfig from omegaconf.bas
コマンドプロンプトからvoicevoxで音声を作る手順
Windowsコマンドプロンプトからvoicevoxで音声を作る手順です。
公式ページのものから少し改変。
chcp 65001echo "こんにちは、音声合成の世界へようこそ" >text.txtcurl -s -X POST "http://127.0.0.1:50021/audio_query_from_preset?preset_id=1" --get --data-urlencode