見出し画像

『Googleレンズに対話型AIを合体。「この花は犬に有毒ですか?」を質問可能に』~【web3&AI-テックビジネスのアイディアのタネ】2024.1.29

先進テックで未来の生活はもっと良くなる!」と信じて、Web3・AI・ガジェットなどのデイリーニュースから毎日ひとつピックアップしてご紹介しています。

新規ビジネスのアイディアのタネがほしい方、未来を想像してワクワクしたい方、読んでちょっといいなと思った方、ぜひフォロー・高評価よろしくお願いします!


■Google Lensがアップデート! 強力なAI検索ツールを今すぐ試そう

たとえばデスクの横にある花を使ってGoogle Lensを試してみました。Lensでその花の写真を撮り、「これは犬に有毒ですか」と尋ねました。

Googleは1分ほど考えた後、生成AIで回答を返しました(要約すると、蘭は犬や猫に有毒ではありません)。

写真を撮って、画像から検索ができる「Googleレンズ」はとても便利ですよね。

少し前にGoogleがテレビCMでやってみせていたように、写真に写った帽子やぬいぐるみなどを画像検索して売っている店を探すなどが簡単にできます。

このGoogleレンズに、対話型AIの機能が合体しました。
これまでは「画像をもとにWebサイトを検索」しかできなかったのが、上記の例でいうと、花の写真を撮って「これは犬に有毒ですか?」と質問してテキストで返答を得るということができるようになりました。

1月17日に公開されていて「今すぐ試そう」とありますが、試してみたところ日本では未公開のようです。


Lensで作り方や道順など何でも聞ける

たとえば、レストランで料理の写真を撮って、その作り方を教えてもらったり、訪れた街の建物の写真を撮って、その歴史や意味を聞いたり、トレーディングカードの写真を撮って、そのカードがどのセットのものなのか、レアなものなのか貴重なものなのかを聞いたりすることもできます。

画像検索に対話型AIが合体するとできることの例として、料理の写真からレシピを尋ねたり、建物の写真から歴史を尋ねたりするなどが挙げられています。

いままでの「画像をもとにWebサイトを検索」はつまり、「これは何ですか?」という質問しかできなかったということでもありますし、その質問の返答が「これらのWebに載っています」しか返せなかったということでもあります。

アップデート後のGoogleレンズでは、「どうやって作るんですか?」や「この商品が売っている店までの道順を教えてください」など、質問の自由度が格段に上がったうえ、「これらのWebに載っています」ではなくズバリの解答を得られるようになるわけです。


ChatGPT「何を聞いていいかわからない」問題へのアンサー

ChatGPTには多くの人が驚きましたが、それ以上に多くの人が使い方がわからず困っています。「何でも聞いてください」とChatGPTが口を開けて待っていても、何を聞いていいかわからないのです。

今回のGoogleレンズに対話型AIを合体させたアップデートは「この商品の最安値の店はどこ?」など知りたいことがあって写真を撮るところからスタートします。何でもできるChatGPTよりも動機から始まるぶん、多くの人に普段使いされる、普及しやすいユーザーインターフェースだと感じます。


ChatGPTはもっとすごかった

GPT-4では、様々なファイルを読み込ませて内容を説明させることが出来ると言われている。これ、場合によってはめっちゃ便利なんじゃね?
というわけで、今回はGPTさんに色んなファイルを読み込ませて検証していくよ!
・検証方法
方法は簡単、ChatGPTではアップロードできるファイルの種類に制限がないから、今回はパソコンにあるファイルを片っ端から読み込ませる
そんで読み込ませたら、「このファイルを説明して」と命令する。返ってきた答えと実際のファイルの内容を照らし合わせて、精度を検証していく。

Googleレンズは画像検索に特化していますが、ChatGPTの有料版、GPT-4は画像以外にもいろんなファイルを読み込ませて中身を解説してもらうことができます。

ロケットニュース24の検証によると、Googleレンズと同じように写真やスクリーンショット、手書きのイラストなどの画像系はもちろん、PDFファイル、WordやPowerPointの資料、プログラムソースなどにも対応しているようです。

冒頭1000文字しか読んでくれず長文の資料に対応できないという問題はありますが、画像以外のさまざまなファイルについて対話型AIに尋ねられるというのはとても強力です。

また、Googleレンズと同じ画像検索にしても

海外の鉄道の写真から

電車に書いてある「KA」のマーク、左上の案内板に書かれている文字、通勤電車であるとの推察、映っている人物の特徴など、さまざまな情報を要約しています。

まずこれを読んだうえで、気になったポイントを質問するという使い方もできるでしょう。


AIが誰でも使えるように

GoogleレンズもChatGPTも、より多くの人にAIが使われやすくする工夫をしているという点では共通です。

Googleはスマホメーカー、OSメーカーという点を活かしてカメラに注目していますが、ChatGPTは高度化のスピードが速いと感じます。

きっとGoogleもGPT-4のような高度化もトライするはずで、AIメーカーとしての切磋琢磨でAIがどんどんブラッシュアップされていくのにはワクワクします。

Appleも黙ってはいられないはずです。次期iOS18ではAIの本格的な組み込みが予想されています。おそらくまた秋の発表だと思いますが、今から楽しみにしています。

この記事が気に入ったらサポートをしてみませんか?