見出し画像

ChatGPTの最新アップデートGPT-4oを試す

本日(2024/05/14)OpenAIが発表したGPT-4oのアップデートについて、特に触れることができる新機能と改善点を中心に試した内容となります。
GPT-4の既存の枠組みを踏襲しながら、マルチモーダル対応を強化したこのアップデートは、おそらくGPT-5への重要な布石となることでしょう。
さて、新たに強化された返答速度や機能性について、具体的に試した結果とともに詳しく見ていきます。

※今回の公式発表には、GPT-5に言及した内容は含まれていません。


応答速度の大幅な向上

発表においては、音声による応答速度に重点を置かれているようですが、テキストベースでも当然速くなっています。平均応答時間は320ミリ秒だそうです。日本時間19時台で確認したところ、通常のGPT-4と比較して約1.5から2倍の速度になった体感です。
下記の比較用GIF画像では、この速度の違いを視覚的に感じ取ることができます。

ChatGPT-4
ChatGPT-4o

賢さは特に変わらず

GPT-4ベースであることは明言されていますが、画像の認識やその他については、やはり既存のままのようです。

画像認識

少ない数や項目であれば、問題なく正確に認識してくれます。
数が増えると途端にダメになりますね。その辺前に検証したのと変わらずです。

ChatGPT-4oで実行した結果です。(左→右で流れでやりとりしています。)
左側では、なんという項目に何色のシールがあるか、正確に読み取れています。
右側では、単にシールの台紙ですが、数が正確にカウントできていません。

コードの実行:FizzBuzz問題

コード実行についても特に変わりは無いようです。下記課題で比較してみましたが、若干GPT-4oの方が速いようです。ただし、この程度であれば誤差の範囲でしょう。しかし、コードを生成してこちらに提示するまでは、GPT-4oの方が圧倒的に速いです。

FizzBuzz問題を解くPythonコードを生成してください。つまり、1から100までの数字を出力しますが、3の倍数の場合は「Fizz」、5の倍数の場合は「Buzz」、3と5の両方の倍数の場合は「FizzBuzz」と出力してください。プログラムを実行し、開始から完了までの時間も出力してください。

プロンプト

実行時間

GPT-4o:0.000340(下記の上側のリンク)
GPT-4  :0.018378(下記の下側のリンク)

※リダイレクトをはさむので、タイトル未設定になってしまいますね…

画像生成

こちらも特に生成速度は変わらずです。内部で動いているのは従来のDALL-E 3です。一応参考として以下に連携します。

左:ChatGPT-4o
右:ChatGPT-4

WEB検索(ブラウジング)

こちらも速いです。ただし、検索エンジン(Google、bing等)よりは若干遅いですが、これだけ速く生成してくれるのなら、より日常使いできそうです。

情報ソースが明示的に出るようになったのも良いですね。今更ですが。

まとめと考察

今回のアップデートで改善された点は徐々にロールアウトされていくことでしょう。そしてさらに今後のアップデートによって、発表内容以上に進化する可能性もあります。
特に注目されるのは、そう遠くないうちに公開されるであろうGPT-5と、将来的にローカル環境で動作する同等性能のAI技術です。この進化により、アシスタントAIが現実のものとなり、私たちの日常生活に密接に関わる存在へと変わっていくことを強く実感します。

追加の考察

個人的に一番気になるのはWindowsより先に来るmac版のアプリです。ここで意識するのは、Appleとの協業ですね。GPT-5の布石というより、こっちの布石かもしれません。しかし、長いこと放置されていたSiriが強化されるのは嬉しいところです。Appleも独自の軽量なLLMをテスト中ですので、今後どのように協奏してくるのか興味深いところです。それとMicrosoftとの関係も気になりますね。Windows版を出してもBingのデスクトップ画面アプリと競合しますから。

GPT-5への布石としては、特に利用者の動向を探る目的が強いようにも感じました。広くアーリーアダプターに利用されたGPT-4は、ほぼ安全になりました。これにマルチモーダルライクな機能を入れたもので遊んでもらい、問題をfixしてからGPT-5にのせて公開される気がします。

注意: 記載した内容は5/14時点のもので、今後数日から数週間のアップデートで大きく変わる可能性があります。

この記事が気に入ったらサポートをしてみませんか?