記事一覧
AIVtuberシロハナちゃん機能一覧(v1.1)の紹介と今後の開発計画
AIVtuberシロハナちゃんの開発プロデュースをしているyukiです。
このnoteでは、AIVtuberシロハナちゃんの配信機能一覧をまとめています。
主に、「どんな機能で」「何ができて」「なぜ実装したのか」などの内容となっています。
また、これから記載するv1.1の内容は2024/05現在の機能になります。
そしてこの記事の後半ではv1.2で予定している開発計画も記載しています。※バージ
ElevenLabs(TTS)のAPI使い方【Pythonサンプルコード有り】
AIVtuberシロハナちゃんの開発プロデュースをしているyukiです。
この記事ではElevenLabsのAPIを試してみたので使い方などを備忘録として残します。
ElevenLabsというツールは簡単にいうと、人間の声を素材として音声クローンを作って合成音声として利用できます。
これはElevenLabsのサイトで利用可能に加えて、APIとして提供もされています。
そこでAPI使う参考に
LivePortraitインストールから使い方まで【画像のキャラ表情を動かそう】
AIVtuberシロハナちゃんの開発プロデュースをしているyukiです。
この記事ではLivePortraitという画像に写っている人物やキャラクターの表情を動かすツールのローカル環境構築と使い方について紹介しています。
以下のように用意した素材動画と静止画を組み合わせることで人物やキャラの表情を動かすことができるというわけですね。
画像や動画素材によってはかなり自然な表情変化が楽しめるので
NotebookLMを使って仕様書などのドキュメントから欲しい情報を嘘なしで答えてもらう
AIVtuberシロハナちゃんの開発プロデュースをしているyukiです。
この記事ではGoogleが出しているNotebookLMというAIサービスを活用して、仕様書等のドキュメントをもっと簡単に情報取得する方法を共有していきます。
みなさんは「この仕様書、文章量多くて読む気が失せる」「しかし、AIだとハルシネーションの可能性ある…」という課題や体験がありませんか?
このNotebookLM
Claude ArtifactsとTTSでAIキャラ自己紹介プレゼンの生成から発表までやってみた
AIVtuberシロハナちゃんの開発プロデュースをしているyukiです。
この記事ではClaudeのArtifacts機能を使って簡単なスライドを作成をして、その内容をもとにTTS(音声合成)で発表までやってみたという内容となっています。(※TTSはClaudeとは別で用意)
これらの2つを組み合せばAIキャラや自身のクローン(ナレッジを入れたAI)をもとにプレゼンを簡単に生成が可能になります
VSCodeからCursorに移行して設定した箇所【文字色・ツールバー】備忘録
AIVtuberシロハナちゃんの開発プロデュースをしているyukiです。
この記事では、私が実際にVSCodeからCursorに乗り換えた際に設定した箇所を備忘録がてらこの記事にまとめます。
基本的にVSCode(デフォルト設定)からCursor(初期設定状態)に移行はスムーズにでき大きな設定などは不要ですが、テキスト色やツールバーの場所が微妙に違っていました。
そこで、VSCode(デフォ
Style-Bert-VITS2のAPIを使ってAIVtuberの音声に反映させる
AIVtuberシロハナちゃんの開発プロデュースをしているyukiです。
この記事では、Style-Bert-VITS2のAPIを使用することで、AIVtuberシロハナの音声がこれまでより感情豊かになったので、その手順や説明をまとめた内容となります。
つまり、Style-Bert-VITS2のAPIの使い方や、音声の学習方法、他音声モデルとのマージなど、Style-Bert-VITS2につい
Gemini - API使って簡単なAIチャット実装してみた
AIVtuberシロハナちゃんの開発プロデュースをしているyukiです。
この記事ではGeminiのAPIを試してみたので使い方などを備忘録として残します。
CLI上でGeminiと会話できるところまで簡単に実装してみました。(サンプルコード貼ってあります)
環境はWindowsで言語はPythonです。
詳細は公式からどうぞ
※この記事は2024/06/3時点のものなので今後変更がある
【Warudo】Live2Dモデルを3D空間に存在させて配信する方法
AIVtuberシロハナちゃん開発とAIヒロイン研究Pをしているyukiです。
今回はWarudoというソフトを使ってLive2DのVtuberを3D空間に存在させて配信する方法についてまとめていきます。
イメージとしては下記のような感じです。
カメラワークも簡単なものなら自動化させたり、様々なアングルでアバターを映すことができます。
そして、Warudoで設定した画面をOBSで取り込めばそ
【GPT-4とClaude3】キャラクター再現が上手なのはどっち?ずんだもんで検証
AIVtuberシロハナちゃん開発とAIヒロイン研究Pをしているyukiです。
今回はタイトルの通り、GPT-4と最近リリースされたClaude3(Opus)を比較してみようと思います。
ただ、普通に比較するだけなら他の方がしっかりまとめているので、AIヒロイン研究Pとして、キャラクター再現にフォーカスを合わせてまとめたいと思います。
YouTubeでもシロハナちゃんが本記事と同じような内容で
GPTs×VOICEVOXで推しキャラが毎回違う内容で話しかけてくれるアラーム
AIVtuberシロハナちゃんの開発プロデュースをしているyukiです。
タイトルの通り、以下の内容をまとめます。
推しキャラ(今回はvoicevoxの小夜というキャラクター)のGPTsを作成して、アラームで使用するセリフ(.txt)を生成
PythonとvoicevoxのAPIを使用して生成したセリフを合成音声ファイルにする(コード貼っておきます)
ブラウザで使えるアラームサイトに音声ファ