見出し画像

【速報】本当のGPT4o越えと噂される Claude 3.5 Sonnet のご紹介(・ω・)


ベンチマーク(公式サイトより引用)


米Anthropic社は米国時間6月21日、Claudeシリーズの最新バージョンである Claude 3.5 Sonnetをリリースしました(・ω・)

このモデルは、先日OpenAIが公開した GPT4oを様々なベンチマークにおいて超越しており、比較的客観的なデータに基づいて「GPT4o」越えといわれている根拠であります(・ω・)



Claude 3.5 SonnetはVision(視覚)能力も大幅に強化されており、上記の動画でも紹介されています(・ω・)  (公式サイトより引用)


「GPT4o越え」の主張の信頼性について

Gemini Pro 1.5の初期バージョンがリリースされたとき、当時の最強AIであったGPT4-Turboを超えたとうわさされていた時期がありました。しかし、のちに検査手法をそろえていないことが判明し、Googleの過大評価を指摘されていたという事実がございます(・ω・) 例えば、0-shotという手法を使ったGPT4-Turboに対して3-shot CoTを用いるなどです(・ω・)

しかしながら今回は表を見る限り厳正な比較を行っており比較的信頼度が高いといえます。公式サイトを訪問すれば無料で会話できるそうなのでぜひ利用してみましょう(・ω・)


コーディングについて

今回のモデル、上で挙げたデータをみると、コーディング能力が群を抜いていることが分かります。コーディングはこのモデルにまかせ、ほかの分野では異なるモデルを使用する、などの使い方もよいでしょう(・ω・)


この記事が気に入ったらサポートをしてみませんか?