見出し画像

【短報】GPT-4o:画像認識の性能、本当に上がってる? 🤔

以前から何度か各種のAIに画像の解釈をさせています。
データアナリストとしての仕事を支援してもらえるのか? あるいはワーカーとしての自分の立場を脅かすような存在になるのか? そういった問題意識からのテストでしたが、2024年春時点としては、「まだまだ玩具の域を出ておらず、業務では使い物にはならない」という印象でした。

さて、2024年5月。ChatGPTからGPT-4oなるものが発表されました。そして、どうやらこのバージョンは画像解析能力が向上したとかいうことになっているらしい。
これは捨て置けないということで、とりあえず前回の試験で使った画像をもう一度引っ張り出してきました。

現時点での結果

うん。微妙。

画像データが折れ線グラフであり、そこに何が示され、どのような要素が含まれているのかは概ね認識できています。しかし、グラフの解釈はかなり変です。座標の読み取りはまだまともに出来ていません。

ここまで、良くも悪くも前回の試験から大きな変化はないように見えます。

まだまだ人間には勝てまい。もうしばらくはデータアナリスト諸氏は焦る必要はなさそうです。まあ半年後にどうなっているかですね。

もちろん、これが無料版でできるようになったという事実は大きいでしょう。GPT-3と比較したなら大いに性能向上が実感できるかもしれません。


この記事が気に入ったらサポートをしてみませんか?