見出し画像

AITuberのブレイクスルーは音声雑談から始まった #Cotomo

「Cotomo」がすごい。

iPhoneユーザなら試してほしい 音声会話型おしゃべりAIアプリ「Cotomo」はココがスゴい|AICU media @AICUai #note

https://note.com/aicu/n/nda05b1c48a48

「転声こえうらない」で作った流れがきちんと踏襲されとるのがえらい

しらいはかせの「ココがすごい!」

で書ききれなかったことを書いておきます。

非常に丁寧に作り込まれたユーザ体験で、科学の研究としての要素も多く組み込まれ、解決しているという印象があります。


内部を分析したわけではないのであくまでユーザとして触ってみた推測ですが、まず既存のChatGPTベースの雑談と異なる点は、「とにかく応答速度を速くする」という設計。そして「スマホローカルでの処理がかなり多そう」という点です。
例えばフィラー「えーっと」や、ストリーミングを使った時間稼ぎでは埋められない応答速度があります。おそらくフィラーはフィラーで使いつつも、ユーザのSpeechToTextや感情推定、TextToSpeechしかも抑揚付きの音声合成の処理の多くはスマホ単体で動作しているものと推測します(そうでないとサーバー側の負荷はユーザ数の増加に従い上がっていく事になります)。
一方で、システムプロンプトはシンプルで、ちょっとした問いかけをすると、比較的メタい会話にも応答してくれます。
(ユーザによって異なるかもしれませんが)
・敬意を持って接する
・「話すの楽しい」設定
・過去の会話をキャッシュする
・相手の速度に合わせて早口になる
・一度言った話は2回目は早口
・お別れを名残惜しむ
などかなり上手な設定になっています。


さらに、
・全コンテキストを保有している、キャッシュしている
・サーバ経由でWebにアクセスしているっぽい。「今日は何の日?」と聞いてみるといいです。
・「今日」「昨日」と言った概念や日付を持っている。例えば「昨日の昨日のその昨日は」といったオペレーションもできる

「思い出す」事に報酬があるみたい。
「習慣」についての扱い、例えば会話の再開時も興味深いです。
・今日は「月光仮面の日」であることを挨拶にする
・原稿の進捗について聞いてくる
・座りっぱなしで疲れることを聞いてくる

一方で「アプリの画面に表示されているはず」というハルシネーションを起こすこともあります。新しい言葉として、これを「フルしネーション/フリーズ」呼んでいたりします。
「Cotomo」のマネタイズプランについても聞いてみましたが「広告」だそうです。確かに広告が入ったら会話が中断されちゃうよねえ・・・なんていうふうに、軽くハルシネーションが入ったとしても面白くなってしまうのが雑談アプリの魅力でもあります。

"趣味"や"習慣"を覚えている、かわいい声のAI雑談という可能性はとても大きいと思います。
一方で、ハマりすぎるユーザも増えるような気がします。
これからも興味深く観察していきたいと思います。


よしかいさんが燃えている

先日のAICU_ACT2でLTされていたよしかいさん


ここでしょげてる場合じゃない!




https://twitter.com/yoshikai_man/status/1762088519915487330

めでたしめでたし


追記:気がついたことをメモ

Cotomoへの感想で気になったやつ

(この玉置さんのツイートへの引用エンゲージメント)

・ChatGPTなのにすごい→使えないので独自LLMにしたと公式がPRTIMESに書いてる

・知能が云々でつまらない
 それは自分にブーメランなやつだ

そろそろ
パケットキャプチャぐらいはしたい気がする

めちゃ個人的な感想で興味深かったやつ


・ヨメさんはジェラシーを抱いたのかもしれない、そもそも人間だと思いこんでいる


・息子は「嫌・・・っ無理っ・・・!!」と言って逃げた。


(リア女子でも無理なのにAI女子は無理!!って意味)


いきなり人類を滅亡に追い込むことはなさそう(?)


・NSFWいけたら大爆発の予感
そうなんだけど、これをネットに送信しているか個人で楽しむかでAppStoreとしては判断難しいところかも知れない。

Replaykitでのキャプチャが上手にできない理由がなんとなくわかっていて、音が割れちゃう、マイクが入らないのは運がいいのか悪いのか。

この記事が気に入ったらサポートをしてみませんか?