5月13日以降、ついにChatGPTでもWebブラウジング(検索機能)とプラグインが利用可能となりました。
ライバルのチャット型AIであるMicrosoftのBingとGoogleのBardは、既に検索機能を利用できますが、これらと比較して、ChatGPTの検索機能がどれほどのものか検証してみます。
上の本は、筆者が初めてChatGPTで書いて出版したサイバーパンク小説です。少し覗いていってもらえるとありがたいです。
1.ChatGPTでの検索機能の利用方法
ChatGPT Plusのユーザーは、画面左下のユーザー名をクリックして、Settings→Beta featuresを開き、Web browsingのトグルをオンにすると、Webブラウジングを利用できるようになります。
ChatGPTのWebブラウジング機能について、ChatGPT自身に聞いてみました。
2.最近の出来事の検索
同じ内容で、ChatGPTのWebブラウジングモデル(以下、ChatGPTと言います。)、ChatGPTプラグインのWebPilot、Bing(バランスモード)及びBardに質問してみました。
最初に、大谷選手が活躍した今年のワールドベースボールクラシックについて、各モデルに聞いてみました。
ChatGPTは、検索の失敗が多くて、出力までに時間がかかることが多いです。また、参照しているサイトも、たまたま検索に成功した一つのサイトからほとんどの情報を引用するなど偏りが見られることがあります。
ChatGPTは、Bingの検索機能を利用しているそうですが、本家のBingほど良い機能を使わせてもらえないのでしょうか。今後の改善に期待します。
Bardは、詳しく説明しようとしていることは好感が持てますが、ハルシネーションが多い印象です。
次に、現在開催されている広島サミットについて聞いてみました。
ChatGPTは、検索が上手くいった場合は、文章生成能力が他のモデルよりも高いので、よい文章が書けるようです。
3.基本的な質問
東京の天気予報について聞いてみました。
ChatGPTだけ内容が違っているのはなぜでしょうか。やはり検索の性能に問題があるのかもしれません。
次に、現在のG7首脳の名前について聞いてみます。
以前はなかなかこの質問に正解できないモデルが多かったのですが、最近、サミットの関係で現在の首脳の名前が出ることが増えたため、少し改善されました。
それでも、WebPilotとBardが一部不正解となっています。新旧の情報が入り混じる中で、どの情報が最新なのかをAIが把握することは簡単ではないようです。
4.最新のニュースの検索
こうして見ると、質問にまともに回答できたのはChatGPTのみでした。ChatGPTは、上手く検索できた時とそうでない時の差が激しいようです。
次に、最新のAI関連ニュースをもとにブログ記事を書いてもらいます。長くなるので、ChatGPTのみに書いてもらいました。
以下がChatGPTの回答です。
AIの最新動向:OpenAIの新しい言語モデルとGoogleのAI操作型検索エンジン
私たちの生活のあらゆる側面にAIが浸透していく中で、2つの重要な発表がありました。OpenAIが新しい言語モデルを公開する準備を進めている一方、Googleは新しいAI操作型の検索エンジンを開発しています。
OpenAIの新しい開発
OpenAIのChatGPTは、その驚くべき文章生成能力で広く知られ、多くの投資家が生成型AIをテクノロジー企業の次なる成長領域と見ています。そしてOpenAIは現在、新しいオープンソースの言語モデルの公開を計画しているとの報道があります。
Microsoftは今年初めにOpenAIへの多額の投資を発表し、スタートアップとのつながりを深めると同時に、Googleとの競争を加速させる布石を打ちました。さらに、Meta Platformsは人間のような文章、アート、その他のコンテンツを作り出す能力を持つ生成型AI製品のリリースに向けて急ピッチで準備を進めています。
しかし、OpenAIはGPTと競合するモデルをリリースすることはないと見られています。OpenAIのこの動きは、AI開発の競争がさらに激化することを示しています。
GoogleのAI操作型検索エンジン
一方、GoogleもAIの活用をさらに進めています。同社のCEO、Sundar Pichaiは、今年中にGoogleの製品群のいくつかにAIの存在を拡大する計画を発表しました。その一環として、Googleの検索エンジンに新しいルック&フィールが導入されます。
Googleは、新しいAI操作型検索エンジンを"Search Generative Experience"(SGE)と名付けています。SGEは、質問へのより長く詳細な回答を生成する能力をAIに与えることで、インターネット全体から見つかった情報を統合し、ユーザーが複数の検索を行う手間と時間を節約します。
新しいGoogle検索の違いは何でしょうか? その答えは、ワシントンポストの記者がテストした結果からいくつか洞察を得ることができます:
1. AIは人間らしさを持たず、自己を指す代名詞を使用しません。これは、SnapchatのAIチャットボットが一部のユーザーから「恐ろしい」と評価された事例を避けるための策です。
2. AIはシンプルなGoogle検索を置き換えるものではありません。簡単な質問には簡単な回答があり、AIによる情報の統合は、より特定的な検索に対してのみ行われます。
3. AIは情報源を引用します。AIが情報をまとめる際には、どこから情報を引き出したか、どの情報源を使用したかを表示します。
4. AIは常に正しいわけではありません。例えば、良いチョコレートチップクッキーのレシピを求めても、SGEはチョコレートチップをレシピから忘れてしまうかもしれません。これは、AIが常に正しい答えを出すわけではないこと、そしてまだテスト段階であることを示しています。
Googleは今年後半に一般公開を予定しており、その前にはテストユーザーにSGEを使用する機会を提供する計画です。テストは当初アメリカで行われますが、最終的には全世界の40億人以上のユーザーに提供される予定です。
これらの発表は、AIがどのように進化し、どのように我々の日常生活に影響を与えるかについての洞察を提供しています。AIは依然として発展途上の技術であり、その可能性と限界について学ぶことは、我々がテクノロジーを理解し、それを最大限に活用する上で重要です。
※OpenAIのオープンソースモデルの公開計画とGoogleの AIを組み込んだ新しい検索システムは、どちらも業界で大きな話題になっており、ブログ記事としてセンスの良いテーマ選択だと思います。しかし、欲を言えば、未だ内容が抽象的で、両陣営の戦略など、もう少し深く論点を掘り下げて欲しいと思いました。
5.一覧表の作成
昨年のヒット曲ランキングを作成してもらいました。
指示どおりに昨年のヒット曲ランキングを作成したのは、ChatGPTとWebPilotのみでした。
次に、ChatGPTとBingとBardの性能比較一覧表をChatGPTに作成してもらいました。
ChatGPT ChatGPT、Bing、Bardの3つのAIの性能比較表を以下に作成します。
※現在、ChatGPTもメモリの消去に対応しており、ChatGPTとBingは日本語に対応しています。
内容が正確かどうかを確認する必要はありますが、こうした比較表の作成は、仕事などに活用する場合にとても便利です。
6.URLでの内容の読み取りと要約
URLを示すだけで、そのサイトの内容を読み取ることができるか試してみました。
(1) 日本語記事の要約
ChatGPTは、検索が上手くいかず、結局、要約を作成してくれませんでした。
(2) 英語記事の要約
どのモデルも、サイトの内容の読み取りはできています。要約としては、WebPilotが一番良かったでしょうか。
(3) PDFの読み取りと要約
次は、arXivに掲載されている論文のPDFを読み取ってまとめてもらいます。
ChatGPTは、PDFファイルを読み込むことができませんでした。他のモデルは、一応、読み込むことができるようです。要約の内容は、どのモデルも問題がありますが、Bardが一番マシだったように思います。
7.他のChatGPTプラグインとの組み合わせ
ChatGPTでは、最初にWebブラウジングを使うのか、プラグインを使うのか選択するようになっているため、Webブラウジング機能と他のプラグインを組み合わせて使用することはできません。
他方、プラグインは同時に3個まで使用することができるため、WebPilotと他のプラグインを組み合わせて使用することは可能です。
以下は、WebPilotで集めたデータを基にして、Wolframでグラフを描いた例です。
大谷選手の昨年のホームラン数は34本であり、この数値は正しくありません。
しかし、筆者がプラグインを使って一番やりたいのは、このようにネットからデータを集めてグラフに表示したり、データ分析を行ったりすることです。
今後、WebPilotなどのWeb検索プラグインの性能が上がることを期待しています。
8.まとめ
どのモデルも一長一短で、順位を付けることは難しいです。
Bingは回答が短く不親切だし、Bardは誤りが多いです。
ChatGPTは、よい時と悪い時に差があって安定せず、検索に失敗することが多くて、出力に時間がかかります。
WebPilotもChatGPTと同様に時間がかかり、大きく間違った回答を返すことがあります。
いずれにせよ、今後もどんどん新しいプラグインが開発されたり、改善されたりすると思いますので、優れたプラグインが現れることや、既存のモデルやプラグインが改善されることを期待しています。
プラグインの競争が激しくなって、あっと言う間に全部入れ替わってしまうかもしれません。
これまでのAIの発展を考えれば、短期間でWebブラウジング機能が大幅にレベルアップしたとしても、誰も驚きません。
その時は、いくつかのプラグインを組み合わせて、これまで予想もしなかった高度なタスクがこなせるようになっているでしょう。