AIによる画像解釈はどれくらい使える? ChatGPT、Claude、Copilot、Geminiを比較してみた (3)
AIによる画像解析機能について検証してみようとした記事の第3弾です。
前回は「ポスター」を試しました。
今回は「自然物実写画像」の解析をやってもらいます。
比較対象としているAIについては第1回目の記事をご参照ください。
「写真」を解析させてみる
近くの公園にて私がスマホのカメラで撮影したサクラです。
余談ですが、満開の花や紅葉を撮影する機会があったら、太陽や街灯に向き合い、ただしその光を木の幹に隠して撮影すると、花々や紅葉だけが光源の光を透過し、光り輝いて美しい写真が撮れます。夜桜で試すと息をのむような美しい写真が得られるのでお勧め。そろそろシーズンなのでお試しあれ。なお夜桜のときは必ず三脚を使ってください。
結果と考察
さっそく結果を示します。
一様に、被写体が満開のサクラであることは認識しているようです。背景が青空であること、季節が春らしいことにも全AIが言及しています。素晴らしい結果ではあります。
しかしどのように被写体が桜だと判断したんでしょうね。たとえば満開の桃の木とかを解釈させたらちゃんとモモと答えてくれるのか? 予想ではやっぱりしれっと桜の花ですと答えてくるんじゃないかな。幹の周りに何か白いものが沢山見えている樹木ぐらいの解像度で、そこに「こういうのは普通サクラである」みたいな情報を外挿しているんじゃないかと想像しています。
それはともかく、それぞれのAIの回答は、前回までのグラフやポスター以上にそれぞれの個性が滲み出ているような気がしますね。
「太い幹」への言及: Copilot、Claude
「美しさ」への言及: Copilot、Genimi、Claude
構図への言及: Copilot
画像からは直接読み取れないはずの関連情報への言及:Gemini
どれが正解とか優劣をつけるとかは難しいですが、ディテールに関してはそれぞれ別の所を見ている感じです。もっとも、同じ質問を繰り返したらどうなるかわかりませんが。
回答の文体にも個性が伺えます。Claudeの文章はいかにも人間が書いたエッセイぽいですね。ブラインドテストで「この中に一つだけ人間が書いた文章があります。どれでしょうか」と人々に問うたとしたら、10人中7人ぐらいはClaudeの回答を指し示すのではないでしょうか。一方で、Geminiの回答はいかにもレポートという感じがします。そして、いつもながら確実にそつのない回答をよこすChatGPT。Copilotはそれらの中間をとった感じです。
暫定評価
方向性が違うので優劣つけがたいですが、今回はGeminiとClaudeを同率1位置ということにしましょう。この画像を基にブログ記事を書くとしたら、Geminiに下書きを書かせ、Claudeで仕上げるのが得策かもしれません。
この記事が参加している募集
この記事が気に入ったらサポートをしてみませんか?