![見出し画像](https://assets.st-note.com/production/uploads/images/139718436/rectangle_large_type_2_cf5c3a5925bba1d941d3a43c22d3ab45.png?width=800)
Photo by
fairview_square
処理速度が速いのは良いけど、GPT-4oは決してGTP-4よりも優れているわけではない。
つい数日前にChatGPTの新しいエンジンである、GPT-4oが発表された。
高速で動作しOCR機能もGTP-4より優れているとされる。
![](https://assets.st-note.com/img/1715770469779-MwL8amnyg5.jpg?width=800)
だが本当に、GPT-4よりもGTP-4oは賢いのだろうか?
最先端のモデルが、旧モデルよりも本当に優れているか、検証してみる。
東大理系の数学の問題を解かせる
2023年の、東京大学理系の数学の問題を解かせてみよう。
![](https://assets.st-note.com/img/1715772595101-Dd1LUO4p8w.jpg?width=800)
この問題の正解は、14/55だ。
GPT-4oの場合
ではまず、GPT-4oに解かせてみる。
![](https://assets.st-note.com/img/1715772809505-ZgohsEuG8B.jpg?width=800)
このプロンプトに対して、以下の返答をした。
問題文自体の読み取りは、正確にできているようだ。
![](https://assets.st-note.com/img/1715772825117-wPWadzRO4n.jpg?width=800)
ところが、推論を進めさせた結果の回答は1/4245。
不正解である。
![](https://assets.st-note.com/img/1715772766352-ilvgytGODZ.jpg?width=800)
GPT-4の場合
では旧バージョンのGPT-4で解かせてみる。
![](https://assets.st-note.com/img/1715772967512-mrM7b2JkA3.jpg?width=800)
同一のプロンプトに対して、問題文の読み取りはGPT-4oと同様にできたようだ。
そして推論を進めさせると、以下のように回答した。
![](https://assets.st-note.com/img/1715773038974-h98Hagjaot.jpg?width=800)
なんと正解である。
これだけを見れば、性能としてはGPT-4のほうが、新バージョンであるGTP-4oを上回る。
高速で動作し、無料版でも使え、APIの利用料も安いGPT-4oだが、ひょっとしたら早くて安いのは、推論能力を犠牲にしているからなのではないだろうか、という疑問が出てきた。
なお、Claudeにも全く期待していないが、解かせてみる。
![](https://assets.st-note.com/img/1715773930158-u65QIvPOuX.jpg?width=800)
Claudeは数学に関してはアホなので、使ってはいけない。
キャッチコピーを生成させる
では、言語能力を試すために、「キャッチコピーの生成」をやらせてみる。
試しに、次のようなプロンプトを入力してみよう。
![](https://assets.st-note.com/img/1715771244818-hAQC2fGtjz.jpg?width=800)
ここから先は
1,463字
/
14画像
![](https://assets.st-note.com/production/uploads/images/21788336/profile_a814a965c70e2a2122d52581bd40660d.jpg?fit=bounds&format=jpeg&quality=85&width=330)
インターネット上における
「生成AIの利活用」
「ライティング」
「webマーケティング」のためのノウハウを発信します。
詳細かつテクニカルな話が多いので、一般の方向けではありません。
生成AI時代の「ライターとマーケティング」の、実践的教科書
¥2,100 / 月
ビジネスマガジン「Books&Apps」の創設者兼ライターの安達裕哉が、生成AIの利用、webメディア運営、マーケティング、SNS利活用の…
この記事が気に入ったらサポートをしてみませんか?