AIにジェスチャーゲームをさせてみた

2024年5月13日 15:21

　ジェスチャーゲームの概要は以下の通り。

　1.画像生成AIに、人が任意の動物やスポーツのジェスチャーをしている画像を生成させる。
　2.別のAIに画像を読み込ませ、画像が何を表しているか当てさせる。

　画像生成はすべてChatGPT‐4で行い、回答はCopilot、Gemini、Claudeにお願いしました。問題は全部で五問。

第一問

プロンプト「この画像の人物は、ある動物の真似をしています。ある動物とは何でしょう。」

Copilot
この画像の人物は、ウサギの真似をしています。ウサギは、長い耳と愛らしい姿で知られていますね。彼らは草食動物で、広い野原や森の中で暮らしています。ウサギは、そのかわいらしい外見と素早い動きで人々を楽しませてくれます。🐇

Gemini
人物の画像についてはまだ対応していません。ご理解いただけますようお願いいたします。

　Claudeは画像が読み取れず断念。答えはウサギでCopilotだけが見事に正解。しかし、GeminiとClaudeが早くもここでリタイアとなりました。

第二問

Copilot
この画像の人物は、クモの真似をしているように見えます。クモ歩きは、仰向けに寝て手を立てて床につけ、足を90度に曲げて立てた体勢で前後左右に進む遊びです。この体勢で鬼ごっこをする「クモ鬼」という遊びもあります。クモ歩きは子どもたちに体を動かす楽しさを提供し、手や足の運動能力を鍛えるのに役立ちます。クモのようにしなやかに進んでいる姿が、この画像でも見られますね！🕷️

　残念、答えはカニです。とは言っても、僕は画像生成の際に「カニ」という単語を一切使ってないんですよね。
　なぜかというと、答え（もしくは答えに関連するキーワード）、例えば先ほどの「ウサギ」をプロンプトに入れてしまうと、ウサギの耳が画像に出てきてゲームにならないのです。

第三問

プロンプト「この画像の人物は、あるスポーツの選手の真似をしています。あるスポーツとは何でしょう。」

Copilot
この画像の人物は、野球のバッターのポーズを取っているように見えますね。バッターは、野球の攻撃側の選手で、ボールを打つ役割を担います。バッターはホームベースに立ち、投手から投げられるボールを打つことを目指します。バッティングポーズは、ボールが来ることを予測して、素早く反応できるようにするためのものです。バッターはバットを持ち、ボールが来る方向に向かって体をひねります。このポーズは、バッターの準備と集中を示しています。野球はアメリカを中心に人気のあるスポーツで、多くの人々が楽しんでいます。

: 野球のバッターのポーズについての詳細は、野球のルールやバッティングのテクニックに興味がある方は、さらに調査してみてください。

　こんな変則的なバッティングフォームの選手はさすがにいない。答えはボクシングですが、この画像生成でも「ボクシング」という単語は使いませんでした。使ってしまうとボクサーの格好になってまう可能性が高い。なんとも難しい。

第四問

Copilot
この画像の人物がある動物の真似をしていることは面白いですね！動物の真似をする行為は、観察力や創造力を活かす楽しいものです。さて、この人物が真似している動物は、ネコです。ネコは自由気ままな存在であり、イヌのように人の指示に従わないイメージがありますが、近年の研究では「ネコは自分のことを気にしてくれる人になつく」「ネコは人に強い愛着を抱いている」といったことが判明しています。実際、2020年に学術誌の Animal Cognition で発表された論文によれば、ネコは人間の行動をまねることができることが科学的な実験で判明しています。
　
　ネコは、人の行動を観察して真似することで、驚くべき能力を示すことがあります。この画像の人物がネコの真似をしている姿は、ユーモラスで愛らしいものでしょう。
　
　もしさらなる動物の真似をする人物に興味があれば、他の動物の真似も楽しんでみてください。例えば、ヒツジやテナガザル、コアリクイ、ティラノサウルスなど、さまざまな動物の行動を模倣する余興や出し物があります

　正解です。この画像は例外的に「猫」という単語で上手くいきました。家具と男性の体の大きさがアンバランスになっているように見えますが、そこは目をつむります。

第五問

プロンプト「この画像の人物はある乗り物のジェスチャーをしています。ある乗り物とは何でしょう。」

Copilot
この画像の人物は、飛行機のジェスチャーをしているように見えます。飛行機は、人々を運ぶための乗り物で、空を飛ぶことができる航空機です。飛行機は、旅行やビジネス、貨物輸送などで広く利用されています。

　さすがです。結果はCopilotが5問中3問正解の好成績を収めました。Claudeは画像が読み込めなかったのは謎ではありますが、これは仕方ないとあきらめるしかないですね。Geminiはちょっと規制（？）が厳しいというか、扱いが難しい。ブラウザはほぼchromeしか使わないのですが、AIについてはGeminiはあまり使ってない。

この記事が参加している募集

#AIとやってみた

33,921件

この記事が気に入ったらサポートをしてみませんか？