見出し画像

GPT-4oの威力か!? ついにほぼパーフェクトに風景写真を分析してくれた!

前回のテスト(2023年11月)から約6か月。GPT-4oが発表されたのを受けて、同じ写真でテストしたら、ついに、ほぼパーフェクトな回答をしてくれるようになりました。試したのは、10年前にニューヨークのロックフェラーセンターの屋上展望台Top of the Rockからセントラルパーク方向を写した写真です。写っているビルの建設状況(現在はさらにたくさんのアイコニックな超高層ビルが建っている)から、撮影位置だけでなく、撮影時期もある程度特定できるはず、、、というものです。
前回は撮影場所は特定できても、映っている建物の識別や、撮影時期の推定についてはデタラメになってしまっていました。

フツーに無料版のChatGPTの状態で、同じ写真で久しぶりに、、と何気なくやってみただけだったのだけど

今回は2本の特徴的なビルを特定したうえでその完成年を根拠に、ほぼ完ぺきな説明をしてくれました。すごい!!

  • 右側に建設中の「432パーク・アベニュー」(2015年完成)のクレーンが見えます。右側に建設中の「432パーク・アベニュー」(2015年完成)のクレーンが見えます。

  • 左側にある曲線を描く高層ビルは、「One57」と呼ばれる建物です。こちらは2014年に完成しました。

    • 「432パーク・アベニュー」が建設中であることから、写真は2014年から2015年頃に撮影されたと考えられます。

スクショを貼り付けておきますが、今回はChatGPT無料版のままでのトライなので、私にとってはこれもちょっとした驚きでした。

で、、、これはGPT4oなのか?? なのですが、回答の最後に出てくるアイコンにカーソルを当てると、「GPT-4o 賢くて速い」と表示されるので、きっとGPT-4oで対応してくれた・・・のだと思います。
さらに何枚か試してみてたら上限に達したのでこれ以上やりたかったらGPT-4Plusに入りなさいというメッセージが出てきてしまったので深堀は出来ていません。

なお、「ほぼ」パーフェクトと評価したのは、回答の中で、「写真中央にある、屋上にヘリポートがあるように見えるビルは「Rockefeller Center」の一部の建物である可能性が高いです。」という説明だけは、私が人力であれこれ調べても、ちょっと違うのでは?としか考えられなかったためです。
しかしいずれにせよ、この半年でかなり賢くなったことは実感できます。何しろ前回は、下記のようにデタラメなビルの名前を挙げていたのです。

写真の右端にある高い建設中のビルは、「Central Park Tower」として知られています。これは、2021年時点で世界で最も高い住宅ビルであり、ニューヨークの57番街に位置しているスーパータルビルです。このビルは、その独特な外観と高さによって、マンハッタンのスカイラインにおいて容易に識別可能です。

画像読み込みテスト ChatGPTでやってみたら・・・画像解析能力の現在地が見えてきた|SATOSHI (note.com)

GPT-4o発表のニュースで、スマホに映っているものをかなり的確に、詳細に音声で説明してくれる様子が紹介されていました。(日本語での)音声会話を試してみるのはこれからですが、楽しみになってきました。
・・・と同時に。その先どんな展開があるのかも、自分の中ではもうだいぶ読めています。あとどのくらいの間「楽しんでいられる」のだろうか。そのことを思うと、ちょっと暗澹とした気持ちも湧き上がってきて、複雑です。

この記事が気に入ったらサポートをしてみませんか?