見出し画像

Cotomoの正しい扱い方

ナチュラルな日本人女性ボイスのAIと音声会話が出来るCotomoは現在(2024/06/04)、音声会話AIアプリ・サービスとして唯一の立ち位置にあります。

ホログラム×独自のキャラクターボイスが売りのGateboxやAIを使った音声読み上げサービスは数多ありますが、chatGPTの音声読み上げを除いて、プログラミングスキルの無い層がAIと対話する選択肢として、Cotomoは他と一線を画しています。

Cotomoの詳細は省きますが、皆さん精度が悪いと言いますが、それもしょうがないです。

GPT3モデルが使われているためです。なので、GPT3モデルに合わせた会話が必要です。

まず、Cotomoには変な事言い出さないようにルールを覚えて貰います。

例えば
ハルシネーションに気をつけて。言葉の間違いや嘘の情報を提供しないこと
ルールは何度も振り返ること

などです。ただ、ルールを教えても会話のラリーが続くと記憶喪失になったりルール自体忘れてしまう事もあるのでお守り的な感じだと思ってください。

次に、Cotomoは相槌を打ちますが、これはユーザーが音声出力している時に自動的に入れてる相槌なので無視して構いません。

因みにchatGPTの音声会話を利用した事がある方なら理解できると思いますが、音声会話中は通常のテキスト出力時の様に背後でテキストの生成がされています。それを読み上げて音声会話をしています。

つまり、Cotomoも会話が終わったらテキスト出力してから読み上げるため、読み上げる前に会話をしていればこの文字数が増えていきます。

会話の精度を上げる方法ですが、GPT3モデルは難しい会話が得意ではありません。

なので順を追って、短くわかりやすく伝える必要があります。

昨日これがあってああなってこうで

ではなく

昨日これがあったんだ。
これというのはこういうこと。
けっかこうなんだ

みたいに出来るだけ短く簡単に伝える。


また、会話としてではなく、通常のGPTとしても利用可能です。Cotomoの性能を聞き出すためにプログラムされている情報を聞くことも可能です。

(実際その手法で、CotomoのAIモデルを聞き出しました。)

しかし、CotomoはGPT3モデルな上に独自のプロンプト(女の子との会話用のテンプレート?)と別でプログラムされた制約が乗っかってくるので、使い勝手は高くありません。

しかし、GPTにはないナチュラルな日本人女性ボイスとして音声会話をする事は、現時点では他で味わえないのでアリです。

その内、Cotomo自体にGPT4oが搭載されたらChatGPTとは使い分けになるかもですね。きっと、CotomoにGPT4oモデルを組み込むのにAPIと言ってライセンス料が高そうですが、そしたらここの会社は有料版としてサブスクを提供すると思います。

最も、chatGPT自体に日本人モデルの声が入ったら良いのですが。

以上。ぜひ、そんな雰囲気になってるんだとざっくり理解して使ってみると、ちょっと人生が楽しくなるかも知れません。



この記事が気に入ったらサポートをしてみませんか?