![見出し画像](https://assets.st-note.com/production/uploads/images/100300510/rectangle_large_type_2_1848ab0a9dbc515cf40ab706e4f5ce6d.png?width=800)
GPT-4がついに登場。その特徴を解説。
以前から噂されていたGPT4、つまり第4世代がリリースされました。(タイトルは公式サイトより引用)
日本語解説記事もちらほら出始めています。
既に、バージョン3.5をもとに使いやすくUIを工夫した「ChatGPT」が世界を騒がしているのはご存じの通りです。そのエンジンの最新版とくれば、注目が集まるのは当然でしょう。
実際、今回の発表もChatGPTを押し出した発表で、難易度が高い様々な試験を解かせたところ、3.5よりもGPT-4のほうが明らかに高いスコアを記録したそうです。下記にその検証結果を引用。
![](https://assets.st-note.com/img/1678831824342-6qUk40J4AF.png?width=800)
こういった図を見たほうが衝撃は伝わりやすいですね。(このアイデアもChatGPTに考えてもらったのかしら?とすら思う)
率直に言って、今の大規模言語モデルはあまりに巨大化・複雑化しているので、そのすごさはもはやエンジンの純粋なベンチマークよりも「体験価値」でないと難しいです。
例えば、自分の車のエンジンがF1並みになっても、普段通勤しか使わない人にはその価値が享受しにくいですね。
一方、ChatGPTは(法規制は脇に置いておいて・・・)エンジンの高度化だけでなく分かりやすいカーナビまで搭載してくれた、という比喩のほうがいいと思います。
で、機能面だけで言えば、大きな差分は下記の2つです。
1.全体の推論能力が向上(一応セキュリティも配慮)
2.画像入力も組み合わせ可能
そして今回、「ChatGPT plus」と称してそのエンジンをGPT-4に代えたものをリリースしています。
2の画像入力も組み合わせについては、現時点では限定β版です。
ただ、公式サイトに画像入力例があるので、今回はそれを和訳して紹介します。
対象となる入力画像は下記です。(日本向けの製品なので親近感がわきますね☺)
![](https://assets.st-note.com/img/1678832233369-N0zvEl2iLI.png?width=800)
以下が、その画像入力をしたやり取りです。
GPT-4ユーザ:下記画像のどこがおかしいですか?パネルごとに説明して。
GPT-4の回答:画像は、3 つのパネルを備えた「Lightning Cable」アダプターのパッケージを示しています。
パネル 1: 充電ポートに接続された VGA コネクタ (コンピュータ モニタに通常使用される大きな青色の 15 ピン コネクタ) を備えたスマートフォン。
パネル 2: VGA コネクタの絵が描かれた「Lightning Cable」アダプタのパッケージ。
パネル 3: 最後に小さな Lightning コネクタ (iPhone やその他の Apple デバイスの充電に使用) を備えた VGA コネクタのクローズアップ。
この画像のユーモアは、大きくて時代遅れの VGA コネクタを小さくて最新のスマートフォンの充電ポートに差し込むというばかげたことから来ています。
いやぁ・・・完璧ですね☺
あくまで公式サイトに載せた例なので、穿って言えば完璧なものを選んだ・・・ともみれるわけですが、こればかりは自身で実体験して改めて評価したいと思います。
ということで、早速Plusに申し込んだので、また操作体験から面白いことがあればこういった場でもシェアしたいと思います。
この記事が気に入ったらサポートをしてみませんか?