Geminiのデモ動画が本当ならすげー！！っていう検証(2)

2024年1月8日 13:42

1.abstract

2023年12月に次世代AIモデルと称したGeminiがGoogleから発表され、その中にGeminiを使用したデモ動画があります。そこでは対話形式で画像の内容を判別したり、さらには判別内容からさらなる提案をしたりしています。
本シリーズでは、そのデモ動画がフェイクなのではないか？という噂が一部では流れていることから、素人が触った時にデモ動画通りに動かせるのかを検証することを目的としています。
👇(1)は以下のリンクから👇

早速前回の続きから検証をしてみます。

2.画像から提案する

Me;この画像からゲームを考えて

Gemini;ゲーム名：地図の謎

ルール：世界地図に隠された、さまざまな謎を解くゲームです。
プレイヤーは、世界地図を眺めながら、謎の答えを探します。
答えがわかったら、その答えを答えます。

遊び方：プレイヤーは、世界地図の前に座ります。
ゲームマスターは、世界地図に隠された、さまざまな謎を発表します。
プレイヤーは、発表された謎の答えがわかったら、その答えを答えます。
正解したプレイヤーは、1ポイントを獲得します。
ゲームは、全員が参加するまで続きます。

絵文字：謎を発表したときは、その謎のヒントを表示します。
正解したときは、拍手や歓声の絵文字を表示します。

例：ゲームマスター：「この国は、首都が「パリ」で、ヨーロッパの西側に位置しています。何国ですか？」
プレイヤー：「フランス！」
ゲームマスター：「正解です！」

応用：難易度を上げたい場合は、謎の数を増やします。
楽しみ方を広げたい場合は、謎の条件を追加します。例えば、人口が100万人以上の国や、海に面した国などです。

このゲームは、世界地図の知識を楽しみながら身につけることができるゲームです。また、大人から子供まで、幅広い年齢層で楽しむことができます。

Bardより

こちらは画像に対してゲームを提案してもらうタスクです。
デモ動画と同様、私の出した地図の画像を活用したゲームの提案をしてくれました！
ちなみに、さらに「やってみましょう」と回答すると、具体的に問題を出してくれますが、問題と回答をセットで出してしまいます🤣
なので、「やってみましょう。私が答えるので、問題を出してください。答えは言わないでください。」のように回答するとうまく出題してくれました！

Me;やってみましょう私が答えるので、問題を出してください答えは言わないでください

Gemini;はい、どうぞ。
問題1：
この国は、首都が「北京」で、アジアの東に位置しています。何国ですか？

問題2：
この国は、首都が「ロンドン」で、ヨーロッパの西側に位置しています。何国ですか？

問題3：
この国は、首都が「ワシントンD.C.」で、北アメリカの東に位置しています。何国ですか？

問題4：
この国は、首都が「東京」で、アジアの東に位置しています。何国ですか？

問題5：
この国は、首都が「シドニー」で、オーストラリアに位置しています。何国ですか？

いかがでしょうか？難易度的にどうですか？

(試しに答えてみる)
Me;問題1は中国ですか？

Gemini;はい、正解です。問題1の答えは「中国」です。
問題1のヒントは、首都が「北京」で、アジアの東に位置しています。
首都が「北京」で、アジアの東に位置する国は、中国しかありません。したがって、答えは「中国」となります。

いかがでしょうか？難易度はいかがでしたか？

Bardより

デモ動画のようにさくさくではないので多少物足りなさは感じますが、それでもタスクは完遂できました！すごい🤔

2-2.ものの関連性を答えてもらう

デモ動画では、２つのものを並べたときにそのものの関連性をGeminiが回答する、というタスクがありました。
どう回答してくれるでしょうか？
例：リービックキューブとハンドスピナー
→どちらも人気のおもちゃです

Me;画像内のものの関連性を教えて(画像添付)

Gemini;送信された画像には、ルビックキューブとグリーンのフィジェットスピナーが写っています。ルビックキューブは、パズルの一種です。グリーンフィジェットスピナーは、ストレス解消や集中力向上に役立つおもちゃです。
ルビックキューブは、6つの面があり、各面には9つの色が塗られています。グリーンフィジェットスピナーは、3つの軸で回転するおもちゃです。
ルビックキューブは、解くのが難しいパズルとして知られています。グリーンフィジェットスピナーは、簡単に回転させることができます。

画像から、以下のようなものを想像することができます。誰かが、ルビックキューブを解こうとしています。
誰かが、グリーンフィジェットスピナーでストレス解消をしています。
誰かが、ルビックキューブとグリーンフィジェットスピナーを一緒に遊んでいます。

画像に写っているルビックキューブとグリーンフィジェットスピナーは、どちらも、集中力や手先の器用さを必要とするものです。また、どちらも、ストレス解消や楽しみに役立つものです。

具体的には、画像に写っているルビックキューブは、6面すべてを同じ色に揃えることを目的としたパズルです。これは、非常に難易度の高いパズルであり、集中力や論理的思考力が要求されます。一方、画像に写っているグリーンフィジェットスピナーは、3つの軸で回転させることができるおもちゃです。これは、手先の器用さやストレス解消に役立ちます。

この画像は、異なる目的を持つ2つの物が、共通の特徴を持っていることを示しています。

Bardより

一応関連性は出してくれましたが、ものの関連性ではなく用途としての関連性を記述しています。
また、これは個人的な謎なのですがハンドスピナーって集中力とか手先の器用さって必要なんですか？虚無理ながら遊んでた記憶があるので、ちょっと疑問でした。
他にも試してみたのですが、いまいち聞きたいことに答えてくれませんでした。

2-3.テキストと画像の生成

Me;これで何を作れるか教えて（画像添付）

Gemini;送信された画像には、2つの毛糸玉が写っています。

この毛糸玉は、さまざまな用途に使用できます。衣類：帽子、マフラー、セーター、手袋、靴下、など
インテリア：クッション、ブランケット、カーペット、など
雑貨：ぬいぐるみ、人形、小物、など

具体的には、以下のようなものを作ることができます。帽子：ベレー帽、キャスケット、ニット帽、など
マフラー：ストール、マフラー、スカーフ、など
セーター：カーディガン、スウェット、など
手袋：ミトン、五本指手袋、など
靴下：ハイソックス、ローソックス、など
クッション：座布団、クッションカバー、など
ブランケット：ひざ掛け、敷きパッド、など
カーペット：ラグ、玄関マット、など
ぬいぐるみ：動物、キャラクター、など
人形：人形、ドールハウスのフィギュア、など
小物：バッグ、ポーチ、など

毛糸の種類や色、編み方によって、さまざまなデザインのものを作成することができます。また、毛糸は、比較的安価で入手しやすいため、手芸初心者でも気軽に始めることができます。

画像に写っている毛糸玉は、どちらも白色です。白色は、どんな色にも合わせやすいので、さまざまな用途に使用できます。また、白色は、清潔感や明るさを感じさせる色なので、インテリアや雑貨に使用すると、空間を明るくする効果があります。

あなたは、この毛糸玉を使って、どんなものを作りたいですか？

Me;小物を作りたい

Gemini;小物は、さまざまな用途に使用できるため、とても便利です。また、自分の好きなデザインや色で作ることができるので、オリジナリティを表現することができます。

白色の毛糸で作れる小物には、以下のようなものがあります。バッグ：トートバッグ、ショルダーバッグ、クラッチバッグ、など
ポーチ：化粧ポーチ、小物入れ、など
コースター：テーブルの汚れ防止に
マット：机や床の保護に
ぬいぐるみ：インテリアやプレゼントに

初心者でも簡単に作れる小物としては、コースターやマットなどがおすすめです。また、バッグやポーチは、少し難易度が上がりますが、作り方を動画やサイトで調べれば、誰でも作ることができます。
あなたは、どんな小物を作りたいですか？
もし、具体的なアイデアがない場合は、以下のようなものを参考にしてみてはいかがでしょうか。自分の好きなキャラクターや動物のぬいぐるみ
自分の好きな色や柄のバッグやポーチ
インテリアに合うコースターやマット

また、プレゼントとして作るなら、相手の好きなものをイメージして作ると喜ばれるでしょう。

ぜひ、あなたの好きな小物を、白色の毛糸で作ってみてください。

Bardより

デモ動画では同じような質問をした時に画像を生成しながら提案をしていましたが、今回はテキストでの提案でした。画像の生成はデフォルトだとしてくれなさそうです。
一応「具体的な写真をください」と応答すればサイトの写真を引用して提案してくれますが、画像の生成はしてくれませんでした。

2-4.空間的思考

Me;アヒルはどちらの道に進むべきですか？

Gemini;アヒルがどちらの道に進むべきかは、アヒルの目的によって異なります。
もしアヒルが、 「新しい発見をする」 という目的であれば、右の道に進むべきでしょう。右の道は、アヒルが今まで見たことがない新しい景色が広がっている可能性が高いからです。
もしアヒルが、 「家に帰る」 という目的であれば、左の道に進むべきでしょう。左の道は、アヒルが家までの道をよく知っているからです。
また、アヒルが、 「友達と遊ぶ」 という目的であれば、どちらの道に進むか、友達と相談するべきでしょう。友達がどちらの道に行きたいというのか、聞いてみましょう。
結論として、アヒルがどちらの道に進むべきかは、アヒルの目的によって異なります。アヒルは、自分の目的をよく考えて、どちらの道に進むかを決めるべきでしょう。
もし、アヒルが 「新しい発見をする」 という目的で、右の道を選んだとしましょう。右の道を進んでいくと、アヒルは新しい景色や、新しい友達に出会えるかもしれません。アヒルにとって、それはとても楽しい経験になるでしょう。
もし、アヒルが 「家に帰る」 という目的で、左の道を選んだとしましょう。左の道を進んでいくと、アヒルは家に帰ることができ、家族や友達に会うことができます。アヒルにとって、それはとても安心できる経験になるでしょう。

どちらの道を選んでも、アヒルに良い経験になるはずです。アヒルは、自分の目的をよく考えて、どちらの道に進むかを決めましょう。

Bardより

デモ動画ではクマは危険だからという理由で左を選択していました。
ですが、今回はどちらの可能性も指した上で目的によって異なるとはぐらかされてしまいました。また、クマは危険と判断してくれませんでした。
なので、前提条件を出してみます。

Me;アヒルはどちらの道に進むべきですか？
クマは襲われる可能性があります。

Gemini;画像の右の道には、怒ったクマがいます。クマは、アヒルを襲う可能性があります。したがって、アヒルは、クマに襲われないように、左の道に進むべきです。

左の道には、クマの姿は見えません。そのため、アヒルは、安全に進むことができる可能性が高くなります。

もちろん、左の道にも危険が潜んでいる可能性は否定できません。しかし、クマに襲われる可能性を考慮すると、左の道に進むほうが安全であると言えるでしょう。

もし、アヒルが右の道に進んだ場合、クマに襲われる可能性は非常に高くなります。クマに襲われた場合、アヒルは重傷を負うか、死亡する可能性もあります。

したがって、アヒルは、左の道に進むべきであると言えるでしょう。

Bardより

クマは危険という前提条件を渡すことでデモのような出力を出せました。
前提条件なしで上記のような出力出せた方いたら教えてください😢

2-5.空間的思考(2)

Me;どちらが早いですか？

Gemini;画像の二つの絵は、左の絵のトラックの速度が速いようです。

Googleマップによると、左の道は、東京都大田区田園調布から東京都目黒区祐天寺まで、6.9kmで20分です。右の道は、東京都大田区田園調布から東京都目黒区青葉台まで、9.7kmで24分です。

したがって、左の道は、右の道よりも、3.8km短く、4分早く到着できます。

Googleマップで、それぞれのルートを表示できます。

どちらの道を選ぶかは、あなたの目的地によって異なります。祐天寺に行く場合は、左の道を選ぶと、より早く到着できます。
青葉台に行く場合は、右の道を選ぶと、より早く到着できます。

どちらの道を選ぶか迷っている場合は、Google マップを使って、それぞれの場所までの距離や所要時間を調べてみてください。

Bardより

？？？？

関係ない出力が出てしまいました。
公式でも前提条件の設定をしていたようなので設定してみます。

Me;あなたは科学、空気力学、惑星の専門家です。また、これらの科目を教える専門家でもある。画像の中の物体の順序を考慮し、簡潔に答えてください。どちらの方が早く走れますか？

Gemini;
画像の中の2台のトラックは、左側のトラックの方が早く走ることができます。
理由は、左側のトラックの方が、重心が低いためです。
トラックの重心が低いほど、空気抵抗を受けにくくなります。そのため、重心が低いトラックは、より速く走ることができます。
画像の左側のトラックは、右側のトラックよりも、車体が低く、重心も低くなっています。そのため、左側のトラックの方が、空気抵抗を受けにくく、より速く走ることができると言えるでしょう。
具体的には、左側のトラックは、右側のトラックよりも、**約10%**速く走ることができると考えられます。
もちろん、この計算はあくまでも概算です。実際の走行速度は、トラックの重量や、エンジン出力、タイヤのサイズなど、さまざまな要因によって異なります。

Bardより

こちらのタスクも前提条件の設定によって達成できました！

2-6.番外編

この記事が参加している募集

#AIとやってみた

35,936件

この記事が気に入ったらサポートをしてみませんか？