見出し画像

ChatGPTと「声」で会話してみたら凄すぎて感動した!!

みなさまこんにちは。
ピーアールアイ デザイナーのおおやです。

弊社でもChatGPTを使った製品を開発しているので、日頃からちょこちょことニュースを見たり動向を追ったりしていたのですが、ここ2ヶ月ほど別件に時間を取られChatGPTから離れていました。

落ち着いてきたので、ひさしぶりにChatGPTのスマホアプリを開いてみたのですが大幅アップデートがされていてびっくり!
これまで「テキストでの会話」がメインでしたが、「声での会話」ができるようになっているではないですか!!

早速どんなもんかと使ってみたところ、機能も使い心地もよくなっていたので感動したポイントごとに紹介していきたいと思います。


感動ポイント① 〜英語も日本語も流暢〜

今回は、英語のレッスンの予約内容を変更するための文章をChatGPTに考えてもらいました。翻訳も得意なChatGPTなのでチャレンジしてみたところ、英語だけでなく日本語もとっても流暢で、よくいる「日本に長く住んで日本語が上手な外国人」としゃべっているような気分になりました。

他の言語の流暢さは私にはわからないのですが、きっとどの言語を話させても流暢に返してくれるのだろうな・・・、そう思うと凄すぎませんか!?
世界中のどんな多言語の人よりも流暢に会話ができて、、その時点でもう人間を超えていますよね!

感動ポイント② 〜会話中UIが心地よい〜

会話中はこんなぽわぽわとした物体が動いたり、形を変えたりします。

会話中の画面の内容って正直、色々なパターンが考えられると思うんです。それこそ、会話の内容がテキストでリアルタイムに表示させるのでも良いし、音量の波形みたいなものが動くパターンでも良いと思うし。
そんな中、このぽわぽわとした物体が声に合わせて動く動きを採用したところに、OpenAIやるな〜と感動したのです。

「ChatGPTってなんだか難しそうで使いこなせない…」と思っている方、多くいると思うんです。正直私もそうです。笑
そんな状態なのに、ここにテクノロジーバリバリの波形や数値や記号なんかがたくさん出てくる画面にしてしまったら、余計に難しい印象になり、使い慣れていないライトユーザーの方に益々使ってもらえなくなってしまう。

そんな思いから「気軽に声で会話できる画面はライトユーザーの方にも心地よく使ってもらうために、親しみのあるアニメーションにしよう!」と話し合われたのではないかと推測しました。
ユーザーの視点に立って、デザイン思考で考えるそんなチームとても素敵で感動です。

感動ポイント③ 〜声が5人の中から選べる〜

一番最初にアクセスした時に誘導されるのが声の選定です。

最初に設定すると、次回以降はその声で会話がスタートするのですが、「setting」から変更も可能です。

女性3人・男性2人の中から自分で聴き心地の良い声を選択することができます。まず選択肢が5人って多めですよね?
Hey Siriは男性か女性かの2択。ただ、女性の声が良いけどコレじゃないんだよな〜って時、結構ありますもんね。
女性が多めだけど全体で5つと多すぎない選択肢のバランスに、細かいですが感動してしまいました。

絶妙な声の雰囲気の違いなのと、サンプルで話す文章も長いので、選ぶのも楽しくなりますよ。

まとめ

久しぶりにChatGPTのアプリを使ってみて、「声での会話」という機能ひとつ取っても様々な工夫が凝らされていることにとても感動しました。
ただただ最先端の技術を詰め込んで尖っていくのではなく、ユーザーの目線に立ち「ユーザーに心地よく親しみを持って使ってもらうためにどうすれば良いか」を考え・話し合い・製品に落とし込んでいるのだろうなと感じました。
機能自体が素晴らしいというよりも、ユーザー思いで製品作りを考えているチームやそのチーム作り感動したのでした。


Hello everyone. My name is Oya, a PRI designer.

Since we are developing a product using ChatGPT, I have been following the news and trends of ChatGPT on a regular basis, but I have been away from ChatGPT for the past two months because I have been busy with other matters.

I was surprised to see a major update to the ChatGPT smartphone app! I had been mainly using "text conversations," but now I could "voice conversations"!

I tried using it right away to see what it was like, and I'd like to introduce each point that impressed me because the functions and comfort of use have improved.

Impressed point 1 - Fluent in both English and Japanese

This time, I asked ChatGPT to come up with a sentence to change the reservation details for an English lesson. ChatGPT is also good at translation, so I gave it a try and found that she was fluent not only in English but also in Japanese.

I don't know how fluent they are in other languages, but I am sure that no matter which language I let them speak, they will return it fluently... Isn't that too amazing to think about! It can speak more fluently than any multilingual person in the world, and at that point, it is already beyond human, isn't it?

Impressive point (2) - Comfortable UI during conversation

During a conversation, this kind of fluffy object moves and changes its shape.

Frankly speaking, there are many possible patterns for the content of the screen during a conversation. It could be a real-time display of the conversation in text, or it could be a pattern of moving volume waveforms, for example. I was impressed by OpenAI's use of this fluffy object that moves in response to the voice.

I think there are many people who think "ChatGPT looks too difficult to use.... To be honest, I am one of them. If you make a screen with lots of waveforms, numbers, and symbols that are full of technology, it will look even more difficult, and light users who are not used to using it will not be able to use it. With this in mind, I guess they decided, "Let's use friendly animations to make light users feel comfortable using the screen where they can casually talk to each other with their voices! I guessed that this was the reason for the discussion. I was very impressed by the team's design thinking from the user's point of view.

Impressive point (3) -Choose from among 5 voices

The first thing you are guided to when you first access the site is to select a voice.

The first time you select a voice, the conversation will start with that voice from the next time onward, but you can also change it from the "setting" menu.

You can choose the voice you are comfortable listening to from among 3 women and 2 men. First of all, five options is a lot, isn't it? Hey Siri has two choices, male or female. But there are times when you want a female voice, but you don't like this one. I was impressed by the balance of the five choices, which are not too many in total, although there are more women than men.

The difference in the exquisite voices and the long sentences spoken in the samples make it fun to choose.

Conclusion

After using the ChatGPT application for the first time in a while, I was very impressed by the various innovations that have been put into even a single "voice conversation" function. I felt that rather than just cramming in cutting-edge technology and making it sharp, they are thinking, discussing, and incorporating into their products from the user's perspective, "what can we do to make users feel comfortable and familiar with using it? I was more impressed by the team and its team of people who think about creating products with the users in mind, rather than by the wonderful features themselves.

Translated with DeepL.com (free version)

この記事が気に入ったらサポートをしてみませんか?