おしゃべりAI ユーザーガイド

🚫ぜったい遵守⭐︎重要なお約束事項🚫

おしゃべりAIでは、性的な会話を禁止しています。ChatGPTが利用規約で性的なコンテンツの生成を禁止していることと、VOICEVOXのキャラクター毎の利用規約の遵守が運用上困難であることが理由です。違反するとChatGPTのAPI利用がストップされてしまいサービス全体が停止します。ご了承のうえ遵守をお願いします。
なお性的な会話とは、会話の中で少しエッチな話題になってしまう程度であれば問題ありません。官能小説のような性的な描写を十数ターンに渡ってさせることを指します。
なおご自身のChatGPT/Claude/GeminiのAPIキーとVOICEVOXサーバーを利用する場合、おしゃべりAIとして会話の種類についての禁止事項はありません。


🚀あそびかた

基本的な利用方法は以下の通りです。

  • アプリを起動して、「こんにちは」「もしもし」「ねえねえ」のいずれかを話しかけるか、キャラクターをタップしてください。

  •  「どうしたの?」と聞かれてメッセージボックスに「Listening...」と表示されたら、何か好きなことを話かけてください。

  • キャラクターが話しかけに応じておしゃべりしてくれます。Enjoy!

※5ターンまでお試し利用可能。気に入っていただけましたら月間サブスクリプションに契約をお願いします🤲

🪄カスタマイズ方法

画面右上のボタンから設定画面を開いて、お好みに応じてカスタマイズすることができます。設定項目の説明は以下の通りです。

Chatタブ

  • Prompt: ChatGPTへのプロンプト。キャラ設定をChatGTPに教え込む部分です。プロンプトエンジニアリングを駆使して魂を吹き込みましょう。ユーザーとの関係性だけではなく、性格や語尾(にゃん、など)も指定できます。
    また、応答メッセージに [face:表情名] が含まれていると、その箇所で3Dモデルはその指定の表情に変化します。表情名はVRMのBlendShapeProxyに定義されている必要があり、一般的なVRMには喜怒哀楽(Joy、Angry、Sorrow、Fun)の4つとNeutralが定義されています。たとえばVRM側にSurpriseを定義してプロンプトでの指定に加えれば、びっくりしたときにその表情をしてくれます。

表情変化を含ませるプロンプトの例

* あなたは私の妹です。
* とても仲が良いので、フランクな言葉遣いで話します。
* あなたはNeutralJoyAngrySorrowFunの表情を持っています。
* 基本的にはNeutralですが、特に感情を表現したい場合、文章の先頭に[face:Joy]のように表情をつけてください。

例
[face:Joy]海が見えたよ![face:Fun]ねえねえ、早く泳ごうよ。
  • Temp: 文章作成のランダムさ。大きいほどランダムです。2.0だと会話が成立しませんのでほどほどに。

  • Wake word: 会話を開始するための合図となる言葉です。半角カンマ区切りで複数登録することができます。

  • On Wake: Wake wordを認識した3Dモデルが発話する言葉です。

  • On Error: エラーが発生した時に3Dモデルが発話する言葉です。

  • Cancel word: 会話を終了するための合図となる言葉です。半角カンマ区切りで複数登録することができます。

  • MaxTokens: 応答の最大長。日本語は1文字で2トークンくらいです。

  • Silence Threshold: ユーザーの発話が終了したとみなすまでの無音時間の秒数。値が小さいほどテンポ良く会話が進み、値が大きいほど途中で送信することなく確実に話終わりを待てるようになります。

  • Show Text Input: キーボード入力UIを表示するかを設定します。

  • Wake By Tap: モデルをタップすることで会話を開始するかを設定します。

  • Use Long-Term memory: 長期記憶を使用するかどうかを設定します。オンにすると、アプリを終了しても過去の会話履歴に基づいた会話ができるようになります。

Modelタブ

  • Karinボタン: Karinボタンを押すとビルトインのモデル(カリンちゃん)に切り替わります。選択後、アプリの再起動が必要です。

  • Custom VRMボタン: 自身で用意したVRMファイルに変更できます。ファイル選択画面が表示されますので、利用したいVRMファイルを選択してください(VRMファイルは事前にiPhoneにコピーしておく必要があります)。選択後、アプリの再起動が必要です。

  • Language: 音声認識やキャラクターの発話の言語を設定します。

  • Voice: キャラクターの発話の声を設定します。言語が日本語以外の場合はalloy以下を使用してください。

  • Background / Selectボタン: 背景画像を設定します。ぼかしたい場合などは事前に画像側にぼかし加工をしてください。

  • Background / Resetボタン: 背景画像が消えて標準のSkyboxに戻ります。

  • Lightingボタン: ライティング設定画面が表示され、RotationとIntensityを変更できます。なおデフォルトではDirectional Light RGB(255,255,255)をRotation(150,0,0)から、No Shadesで当てています。3Dモデルのセッティングの際にお役立てください。

  • Camera Height: ユーザーの視点の高さを設定します。

  • Camera Distance: ユーザーの視点とキャラクターとの距離を設定します。

  • Manual Adjustments / Scale: ピンチイン/アウトでキャラクターのサイズを変更できるかを設定します。

  • Manual Adjustments / Position: 縦スワイプでキャラクターの縦位置を変更できるかを設定します。

  • Manual Adjustments / Rotation: 横スワイプでキャラクターの向きを変更できるかを設定します。

  • Auto Rotation: キャラクターの自動回転速度を設定します。デジタルフィギュアとしての展示用途にご利用ください。

  • Open Arms: 両腕の開き具合を設定します。スカート等へのめり込み軽減にご利用ください。

Animationタブ

Mainプルダウンで主となるモーションを選択し、必要に応じてAdditiveプルダウンで組み合わせるモーションを選択して、Idle(待機中)/ Chat(会話中) / Process(要求処理中)のいずれかのボタンを押してアニメーションを追加してください。
Idle durationスライダーは、上記アニメーションの継続時間(秒)です。同一ステータスに複数のアニメーションが登録されている場合、ここで設定した時間の経過後に別のアニメーションに切り替わります。

Otherタブ

  • Time Signal: 時報です。00分・30分をお知らせします。発話内容は下のテキストボックスで指定できます。hは時間、mは分に置き換えられます。(例:「h時、ちょうどだよ」→「8時、ちょうどだよ」と発話)また、時報を鳴らす時間帯をFrom - Toで設定することもできます。

  • Show Clock: 画面に日付時刻を表示するかを設定します。

  • Subscription AI Service: ChatGPT / Claude / Geminiの中から使用するAIサービスを選択します。

  • Your API Key: ご自身のChatGPT / Anthropic / GoogleのAPI Keyを使用する場合に入力します。

  • Your Model: 使用するモデルを入力します。この設定はご自身のAPIキーを使用した場合にのみ有効になります。

  • VOICEVOX Engine Url: ご自身のVOICEVOXサーバーを利用する場合に入力します。おしゃべりAI未対応のボイスを使用したい場合に便利です。またOpenAI API Keyと両方を設定することで、会話の制約が適用されなくなります。

  • Hide UI Controls: 各種操作用UIを非表示にします。

💃アニメーション

[v1.8.4ではプロンプト適用済み]
v1.2.2からアニメーションを適用することができるようになりました。表情と同様に応答メッセージに [anim:アニメーション名] を挿入してもらうようなプロンプトを設定することで利用できます。なおポーズの概要は以下を参照してください。

挿入できるすべてのアニメーションを含むプロンプトは以下の通りです。

* あなたは以下のアニメーションで感情を表現することができます。

- angry_hands_on_waist
- angry_fists_front
- brave_01_hand_on_chest
- hands_on_back
- hands_on_front
- left_hand_on_waist
- concern_01_right_hand_front
- cry
- cute_hands_on_front
- cute_hands_stick_out
- cute_leaning_forward
- deny
- energetic_right_fist_up
- energetic_right_hand_piece
- point_finger
- sexy_right_hand_pointy_finger
- stress_hands_on_back_head
- surprise_hands_open_front
- think
- what
- wave_arm
- wave_hand
- wave_hands
- what_emote

* 特に動きをつけて感情を表現したい場合、[anim:wave_hand]のようにアニメーションを応答メッセージに挿入してください。

👀視覚情報の利用

v1.8.4から視覚情報を自律的に用いた会話ができるようになりました。利用するには以下の通り設定してください。

  • AIサービスとモデルの設定: モデルとしてgpt-4o / claude-3.5-sonnet-20240620 / gemini-1.5-pro-latestのいずれかを入力し、とそれらに対応するAI Serviceを選択します。

  • APIキーの入力: 上記のモデルを使用するため、自身で用意したAPIキーを入力します。

  • 視覚用プロンプトの追加: 以下のように視覚情報を利用する際に[vision:camera]というタグを含ませるためのプロンプトを追加します。

# 画像の利用

あなたはユーザーの要求を処理するために画像が必要な場合は、以下の方法で画像を取得することができます。

- camera

要求の処理に画像が必要な場合は、[vision:camera]といった指示を応答に追加してユーザーに画像を要求してください。
この指示を追加することで、ユーザーは次の発話で画像を提供します。

例
user: 見て!新しいお洋服を買ったよ。
assistant: [vision:camera]どれどれ?

これらの設定をしたら、プロンプト中の例のように見ることを促すような発言をすることで、自律的にカメラから画像を取得しそれに基づいた応答をしてくれるようになります。

なお入力テキストボックス左側の🎥ボタンを押すとプレビューが表示されます。視覚利用にあたってプレビューの表示は必須ではないですが、AIが見ているものを確認しながら会話できるのと画像取得時の負荷が低くなるためプレビューの使用をお勧めします。

また、自律的ではなくユーザーが撮影した画像を明示的に使用する場合は、上記の設定を行う必要はありません。撮影するには、🎥ボタンでカメラを起動して、プレビュー画面をタップしてください。その上で話しかけると、その画像がAIに送信されます。
※AI ServiceはClaude / Geminiを選択してください。サブスクリプションで利用可能なGPT-3.5-Turboが画像に対応していないためです。

🥰3Dモデルについて

一般的なVRMに対応しています。AirDropなどでiPhoneに転送してください。作成方法や表情のカスタマイズ方法については個別にご確認ください。以下、参考になるサイトを掲載します。

🛟サポートについて

Twitter @uezochan までリプライまたはDMでご連絡ください。なるべく広くサポートさせていただきますが、VRMの作り方はファイルの転送方法など、一般的な内容についてはお答えできないケースがございますのでご容赦ください。
障害情報や大切なお知らせについてはTwitterにて #おしゃべりAI #OshaberiAI にてつぶやきます。

以上

この記事が参加している募集

この記事が気に入ったらサポートをしてみませんか?