1.abstract
2023年12月に次世代AIモデルと称したGeminiがGoogleから発表され、その中にGeminiを使用したデモ動画があります。そこでは対話形式で画像の内容を判別したり、さらには判別内容からさらなる提案をしたりしています。
本シリーズでは、そのデモ動画がフェイクなのではないか?という噂が一部では流れていることから、素人が触った時にデモ動画通りに動かせるのかを検証することを目的としています。
👇(1)は以下のリンクから👇
早速前回の続きから検証をしてみます。
2.画像から提案する
こちらは画像に対してゲームを提案してもらうタスクです。
デモ動画と同様、私の出した地図の画像を活用したゲームの提案をしてくれました!
ちなみに、さらに「やってみましょう」と回答すると、具体的に問題を出してくれますが、問題と回答をセットで出してしまいます🤣
なので、「やってみましょう。私が答えるので、問題を出してください。 答えは言わないでください。」のように回答するとうまく出題してくれました!
デモ動画のようにさくさくではないので多少物足りなさは感じますが、それでもタスクは完遂できました!すごい🤔
2-2.ものの関連性を答えてもらう
デモ動画では、2つのものを並べたときにそのものの関連性をGeminiが回答する、というタスクがありました。
どう回答してくれるでしょうか?
例:リービックキューブとハンドスピナー
→どちらも人気のおもちゃです
一応関連性は出してくれましたが、ものの関連性ではなく用途としての関連性を記述しています。
また、これは個人的な謎なのですがハンドスピナーって集中力とか手先の器用さって必要なんですか?虚無理ながら遊んでた記憶があるので、ちょっと疑問でした。
他にも試してみたのですが、いまいち聞きたいことに答えてくれませんでした。
2-3.テキストと画像の生成
デモ動画では同じような質問をした時に画像を生成しながら提案をしていましたが、今回はテキストでの提案でした。画像の生成はデフォルトだとしてくれなさそうです。
一応「具体的な写真をください」と応答すればサイトの写真を引用して提案してくれますが、画像の生成はしてくれませんでした。
2-4.空間的思考
デモ動画ではクマは危険だからという理由で左を選択していました。
ですが、今回はどちらの可能性も指した上で目的によって異なるとはぐらかされてしまいました。また、クマは危険と判断してくれませんでした。
なので、前提条件を出してみます。
クマは危険という前提条件を渡すことでデモのような出力を出せました。
前提条件なしで上記のような出力出せた方いたら教えてください😢
2-5.空間的思考(2)
????
関係ない出力が出てしまいました。
公式でも前提条件の設定をしていたようなので設定してみます。
こちらのタスクも前提条件の設定によって達成できました!
2-6.番外編