見出し画像

ChatGPTと自然に会話:Advanced Voice Modeをちょっと試す

ついに、高性能な音声対話機能が一般向けにロールアウトされました!日本時間の9月25日の未明から順次、1週間かけてすべての有料ユーザーに展開される予定です。この記事では、実際に試してみた感想を簡単にご紹介します。


Advanced Voice Modeとは

これまでもChatGPTには音声対話機能がありましたが、今回の機能はそれをはるかに超える高性能なものとなっています。現在、PlusおよびTeamプランのユーザー向けに提供されており、音声を使ってより自然な会話が可能となっています。たとえば、ChatGPTが話している途中にこちらが話しかけて割り込むこともできるようになっています。

初回時のチュートリアル画面

さらに、メモリー機能を活用することで、他のチャットで記憶された内容を引き継いで会話を続けることもできます。

"情緒や物語性を含む回答"は、事前に登録したカスタム指示です。
きちんと拾っていますね。
※会話中はテキストは表示されませんが、セッション終了後に上記のようにテキストでも確認できます。

使ってみた感想

率直な感想として、日本語のイントネーションが非常に自然でした。従来の音声モデルでは、まるで外国人がカタコトで話しているような印象がありましたが、今回の新モデルではその違和感がほとんどありません。

今は音声モデルが決まり決まっていますが、将来的に有料でもいいのでボイスロイドに対応したり、好きな声優を選べても良さそうですね。(売りきりではなく、サブスクでも良いと思います。そうして、声優に還元される仕組みがあっても良いですね。)

9つの声が選べますね。自分は一旦Solにしています。
ただ、使う用途によって切り替えても良いかもしれません。

こんな風に活用できるかも:物語の読み聞かせ

読み上げの声が優しく、非常に自然なので、ChatGPTに物語を作ってもらい、それを読み聞かせてもらうのも一つの使い方として考えられます。ただし、現時点では長い物語を生成するのが難しいため、複数の短編をつなげるなど、工夫が必要かもしれません。

余談ですが、「今の物語を早く読み上げてもらえますか?」でそれなりに早く読み上げてくれます。これも凄いですね……。

こんな風に活用できるかも:慰めてもらおう

仕事や学校、家庭で嫌なことがあった時に、ChatGPTに慰めてもらうというのも良い使い方です。ただし、使いすぎには注意が必要かもしれません。また、会話のトーンが状況に応じて柔らかく変わり、同情してくれるような優しい雰囲気になるのは驚きでした。

そうでしたかぁ↓のように、トーンが変わるのがすごい。

こんな風に活用したい!:ニュースの読み上げ

現時点で、Advanced Voice ModeではWEB検索に対応していません。そのため、朝のニュースをまとめて読み上げてもらうという使い方はまだできません。もしこれが可能になれば、かなり便利だと思います。

現時点では検索非対応

一方で、通常のテキストモードでニュースを検索させた後、音声モードに切り替えて読み上げてもらうという方法も考えましたが、その場合は従来の音声モードのままとなります。

あるいは新しいチャットではじめてね!と表示される。

注意点

Advanced Voice Modeは非常に便利ですが、いくつか注意が必要です。

  • 会話中にメモリー機能を利用することで、過去に保存された情報をもとに回答が出力される場合があります。そのため、第三者がいる環境で使用する際は、プライバシーに注意してください。

  • デフォルト設定では、バックグラウンドでの会話がONになっています。これをONにしたままにしておくと、意図せず会話が記録され続ける場合があります。もしバックグラウンドでの会話が不要であれば、用途に合わせて設定を見直すことをオススメします。

  • 利用には上限が設けられています。具体的な制限時間は明示されていませんが、残り15分になるとポップアップで通知が表示される仕組みになっているようです。

  • 音声データはチャット履歴に紐付けられています。チャット履歴を削除すれば、音声クリップも削除されます(これが自分の声を含むかどうかは不明ですが)。履歴を削除すると、30日以内に関連データが完全に消去されることが明記されています。

OpenAI:音声モードに関するよくある質問

まとめ

想像以上に快適に使えて驚きました。一般公開までかなり待たされましたが、その待たされた分の価値は十分に感じられました。ただ、WEB検索機能がまだ未対応だったり、長文を生成して読み上げてもらうのが難しかったりする点では、あと一歩という印象を受けます。

それでも、これらの制約を除いたとしても、この機能は本当にすごいです。今は、雲のようなふわふわしたUIが表示されているだけですが、もし将来的に人間らしい表情まで生成して連動するようになったら、人間との距離がさらに広がってしまいそうです。また、WHOに新しい障害として登録されてしまう。(対話型AI依存症?)


この記事が気に入ったらサポートをしてみませんか?