ジェスチャーゲームの概要は以下の通り。
1.画像生成AIに、人が任意の動物やスポーツのジェスチャーをしている画像を生成させる。
2.別のAIに画像を読み込ませ、画像が何を表しているか当てさせる。
画像生成はすべてChatGPT‐4で行い、回答はCopilot、Gemini、Claudeにお願いしました。問題は全部で五問。
第一問
Claudeは画像が読み取れず断念。答えはウサギでCopilotだけが見事に正解。しかし、GeminiとClaudeが早くもここでリタイアとなりました。
第二問
残念、答えはカニです。とは言っても、僕は画像生成の際に「カニ」という単語を一切使ってないんですよね。
なぜかというと、答え(もしくは答えに関連するキーワード)、例えば先ほどの「ウサギ」をプロンプトに入れてしまうと、ウサギの耳が画像に出てきてゲームにならないのです。
第三問
こんな変則的なバッティングフォームの選手はさすがにいない。答えはボクシングですが、この画像生成でも「ボクシング」という単語は使いませんでした。使ってしまうとボクサーの格好になってまう可能性が高い。なんとも難しい。
第四問
正解です。この画像は例外的に「猫」という単語で上手くいきました。家具と男性の体の大きさがアンバランスになっているように見えますが、そこは目をつむります。
第五問
さすがです。結果はCopilotが5問中3問正解の好成績を収めました。Claudeは画像が読み込めなかったのは謎ではありますが、これは仕方ないとあきらめるしかないですね。Geminiはちょっと規制(?)が厳しいというか、扱いが難しい。ブラウザはほぼchromeしか使わないのですが、AIについてはGeminiはあまり使ってない。