見出し画像

音声対話を人間並みに強化した「GPT-4o」登場

日本時間で5/14 2時(13日深夜)に、ChatGPTを運営するOpenAIより発表がありました。
早くも日本メディアも記事にしており、注目の高さが伺えます。

アーカイブも見ることもできます。

今回の差分は、タイトルにもある「GPT-4o」です。

私は有料会員ですが、リリース後に覗いてみると、早速実装されていました。このスピード感は凄いですね。ちなみに、発表によると無料会員にも数週間内に提供予定とのことです。

ChatGPT画面

売りは音声技術とのこと。
応答時間は最小で232ミリ秒、平均でも320ミリ秒です。ピンとこないと思いますが、これは人間の平均的な会話における応答速度と同じです。

上記動画で、実際に対話している動画が見れます。宣伝動画なのでそのまま素直には受け取れませんが、確かにスピード感はギャップがないですね。

ちなみに、動画を見てない方のために補足しておくと、プログラムコードの作成支援を音声でしている様子が紹介されています。
コードは論理の集合体なので、やや無難なものを選んだのかなと思います。できれば万人向けの日常対話をもっと見せてほしかったですね。
いずれにせよ、今日から早速自身でも触ってみて判断しようと思います。

ちなみに、iPhoneアプリでも実装されていて、早速音声対話を試しているところです。
日本語で対話させたところ、最新モデルについては既にGPT-4oについて説明してくれました。内容はリリースの内容と基本的におなじでした。

この新しいモデルはAPIでの提供も行い、現行最新のGPT-4 Turboと比べて2倍高速、価格は50%安価に、レートリミットは5倍に拡張されるそうです。
より、商業化の勢いが高まるのは必至でしょう。

そして、その中でやはり連想したのが、6月に最大イベントを控えているAppleとの提携です。

ようは、今回の新製品発表はその布石とも見えるわけです。

iPhoneが標準で(Siriエンジンでなく)GPT-4oが統合される可能性がある、ということですね。

少なくとも、今回の発表が(少なくともAppleファンにとっては)Apple
のイベントへの注目を集めることにはなるでしょう。

いずれにせよ、しばらくはこの新しい音声対話モデルとの対話を続けたいと思います。

この記事が気に入ったらサポートをしてみませんか?