見出し画像

ChatGPTのWebブラウジング機能をBingやBardと比較してみた

5月13日以降、ついにChatGPTでもWebブラウジング(検索機能)とプラグインが利用可能となりました。
ライバルのチャット型AIであるMicrosoftのBingとGoogleのBardは、既に検索機能を利用できますが、これらと比較して、ChatGPTの検索機能がどれほどのものか検証してみます。

上の本は、筆者が初めてChatGPTで書いて出版したサイバーパンク小説です。少し覗いていってもらえるとありがたいです。


1.ChatGPTでの検索機能の利用方法

ChatGPT Plusのユーザーは、画面左下のユーザー名をクリックして、Settings→Beta featuresを開き、Web browsingのトグルをオンにすると、Webブラウジングを利用できるようになります。

Settingsの新機能設定画面

ChatGPTのWebブラウジング機能について、ChatGPT自身に聞いてみました。

入力 ChatGPTのWebブラウジング機能の概要や仕組みについて詳しく教えてください。また、Webブラウジング機能のおすすめの使い方についても教えてください。

出力 ChatGPTのWebブラウジング機能は、人間がインターネットで情報を検索するのと似たような方法で、情報を検索し、取得し、それを元に情報提供を行います。具体的な機能としては、検索エンジンへのクエリの発行、ウェブページのクリック、テキストスパンの引用、前のページへの戻り、ウェブページのスクロール、特定のURLのオープンなどがあります。

しかし、ブラウジング機能は「読み取り専用」であり、リアルタイムのインタラクションやパーソナライズされた情報の取得(例えば、ログインした状態での情報、またはダイナミックに変化するウェブコンテンツ)は行うことはできません。

さらに、ChatGPTはブラウジングセッション中の情報を永続的に記憶する能力がありません。ブラウジングセッションが終了すると、そのセッション中に取得した情報はすべて忘れます。

おすすめの使い方としては、以下のような場面が考えられます:
1.最新の情報を取得する:ChatGPTは2021年までの情報しか持っていませんので、それ以降の最新の情報を得るためには、Webブラウジング機能を使用します。
2.特定のウェブサイトから情報を取得する:特定のウェブサイトからの情報を得るためには、そのURLを直接オープンすることができます。
3.詳細なリサーチを行う:特定のトピックについてより詳細なリサーチを行いたい場合、複数の情報源を横断的に検索することができます。
4.情報の信憑性を確認する:ChatGPTから提供された情報の信憑性を確認したい場合、Webブラウジング機能を使って情報源を調査することができます。

それぞれの場面で、Webブラウジング機能を適切に活用することで、より幅広い情報を得ることが可能になります。

ChatGPTへの質問と回答

2.最近の出来事の検索

同じ内容で、ChatGPTのWebブラウジングモデル(以下、ChatGPTと言います。)、ChatGPTプラグインのWebPilotBing(バランスモード)及びBardに質問してみました。

最初に、大谷選手が活躍した今年のワールドベースボールクラシックについて、各モデルに聞いてみました。

入力 2023年ワールドベースボールクラシックの優勝国と活躍した選手について教えてください。

ChatGPT 2023年のワールドベースボールクラシックの優勝国は日本でした。
注目した選手としては以下のような選手がいます:
1.Shohei Ohtani(日本):MVPとなり、Pool Bプレイで無敗の日本を引っ張った。打率.500、本塁打1本、三塁打3本を記録し、またマウンドでは4イニングを無失点に抑えた​。
2.Kensuke Kondoh(日本)、Yadil Mujica(キューバ)、Kunwoo Park(韓国)、Se Woong Park(韓国)、Roki Sasaki(日本)、Yoshinobu Yamamoto(日本):特にピッチャーのSe Woong ParkとRoki Sasakiは注目を集めた。Se Woong ParkはPool Bプレイで2試合に登板し、6イニングを無失点、被安打1、与四球0、奪三振9と活躍。Roki Sasakiは3.2イニングで8奪三振を記録した​​。
3.Yu Chang(台湾):4試合で打率.438、出塁率.500、長打率.938を記録し、2本のホームランを打った​。
4.José De León(プエルトリコ):1試合で5.2イニングを投げ、被安打0(ホームラン0)、奪三振10、与四球0、防御率0.00を記録した​​。

以上の選手たちが2023年ワールドベースボールクラシックで素晴らしい活躍を見せました。
*検索の失敗が多く、結果が出力されるまでに時間がかかります。優勝国が日本というのは正しいですが、注目選手の記述は、参照サイトを確認すると、第1ラウンドまでの成績でした。

WebPilot 2023年のワールドベースボールクラシックの優勝国は日本で、これは大会史上3度目の優勝となりました。決勝戦ではアメリカを3-2で破りました。特に注目すべき活躍を見せた選手としては、村上宗隆選手と岡本和真選手がホームランを打ち、日本の勝利に大いに貢献しました。
*ChatGPTよりはマシですが、検索に時間がかかります。また、内容は正しいですが、決勝戦で大谷選手が救援投手として活躍したことも書くべきでしょう。

Bing 2023年のワールドベースボールクラシックは、日本が優勝しました。大谷翔平選手がMVPに選ばれました。詳細は、Wikipediaの2023 ワールド・ベースボール・クラシックをご覧ください。
*Bingは、規制強化後は、短くて不親切な回答が多いです。

Bard 2023年ワールドベースボールクラシックは、2023年3月に開催された第5回大会です。日本が3大会ぶり3回目の優勝を果たしました。
優勝した日本代表の活躍した選手をいくつか挙げます。

・大谷翔平:投手と野手の両方で活躍した二刀流のスーパースター。2試合に先発登板し、11回2/3を投げ、1勝1敗、防御率3.00。打者としても11打数5安打、1本塁打、3打点と貢献しました。
・柳田悠岐:11試合に出場し、17安打、3本塁打、10打点と打線を牽引しました。
・山田哲人:11試合に出場し、11打数5安打、2本塁打、5打点と打撃好調で、守備でも中堅手として安定したプレーを見せました。
・涌井秀章:3試合に登板し、2勝0敗、防御率2.25と好投しました。
日本代表は、強力な打線と投手陣で、7戦全勝で優勝を果たしました。
*内容に誤りが多いです。大谷選手の場合、正確には9回2/3を投げ、2勝0敗1セーブで防御率1.86。打者としては、23打数10安打で1本塁打8打点です。数字がほとんど間違っています。

ChatGPTは、検索の失敗が多くて、出力までに時間がかかることが多いです。また、参照しているサイトも、たまたま検索に成功した一つのサイトからほとんどの情報を引用するなど偏りが見られることがあります。
ChatGPTは、Bingの検索機能を利用しているそうですが、本家のBingほど良い機能を使わせてもらえないのでしょうか。今後の改善に期待します。
Bardは、詳しく説明しようとしていることは好感が持てますが、ハルシネーションが多い印象です。

次に、現在開催されている広島サミットについて聞いてみました。

入力 現在行われている広島サミットについて教えてください。

ChatGPT 現在行われているG7広島サミットは、2023年5月19日から3日間の日程で開催されています。議長国である日本は、ロシアや中国の動向を踏まえ、法の支配に基づく国際秩序の維持・強化に向けてG7の結束を示したいと考えています。被爆地である広島でのサミットでは、核廃絶に向けてどのようなメッセージを打ち出せるかが焦点になっています。また、日本の岸田総理大臣は、核廃絶の機運を高めたいと考えており、これもサミットでの重要なテーマです​。

サミットではウクライナ侵攻や米中対立などを背景に、経済安全保障に焦点を当てた議論が行われます。また、"経済的威圧"に対抗するための枠組み作り、化石燃料の段階的廃止を目指す二酸化炭素排出削減対策、生成AI(例えばChatGPT)に関する著作権侵害や偽情報への対応などが議題に上がっています。さらに、途上国や新興国に対する農業支援の在り方についても議論され、これらの議論結果は首脳宣言や成果文書としてまとめられる予定です​。

特に、生成AIについては国内のIT企業からも注目されています。AIを活用したビジネスが阻害されないよう、議論は慎重に行われるべきだとの声が上がっています。具体的には、生成AIの利用や規制のあり方についての議論が進行中で、その中でAIの活用と規制の両立が重要との意見が出されています​。
*NHKのニュースを参照したようで、サミットの議題がよくまとめられています。

WebPilot 現在、広島市でG7サミット(主要7カ国首脳会議)が開催されています。このサミットは2023年5月19日から21日まで行われており、各国首脳の動きや会議の議題などが注目されています。

フランスのマクロン大統領が広島に到着し、また岸田文雄首相が各国首脳を出迎えています。岸田首相はイタリアのメローニ首相との首脳外交を開始し、またアメリカのバイデン大統領との日米首脳会談も行われました。

サミット開幕に向けて、広島市内では厳戒態勢が敷かれ、首脳が訪れる平和公園周辺などでは立ち入り制限が始まっています。
*サミットの議題の内容に関する記述がありません。

Bing 2023年5月19日から21日まで、広島県広島市で先進7カ国首脳会議(G7サミット)が開催されています。G7サミットは、主要7か国の首脳が集まり、世界の経済や政治、安全保障などについて議論する会議です。今回の広島サミットでは、核兵器廃絶や気候変動対策などが議題に上がる予定です。
*回答が短く無難にまとまっています。今回の目玉であるウクライナ問題やAIの問題も取り上げて欲しいところです。

Bard
 2023年5月19日から21日まで、広島で第49回先進国首脳会議(G7サミット)が開催されます。これは、核兵器廃絶を呼びかける被爆地でのG7首脳会議としては初めてのことです。

G7は、フランス、ドイツ、イタリア、日本、カナダ、英国、米国、欧州連合の7か国で構成されています。G7サミットは、世界経済、安全保障、気候変動など、世界の最も差し迫った課題について話し合うための年次会議です。

今年のG7サミットは、ウクライナでの戦争、世界経済の不確実性、気候変動など、多くの課題に直面しています。G7首脳は、これらの課題に対処するための協力を強化することを目指しています。

G7サミットは、一般公開ではありませんが、一部のセッションは一般に公開されます。また、G7サミットでは、広島市でいくつかのイベントが開催されます。
*Bardは結果の出力が非常に速いです。今回は内容の誤りは特にないようです。

ChatGPTは、検索が上手くいった場合は、文章生成能力が他のモデルよりも高いので、よい文章が書けるようです。


3.基本的な質問

東京の天気予報について聞いてみました。

入力 明日の東京の天気予報について教えてください。

ChatGPT 明日の東京の天気予報では、晴れて無雲の空が予想されています。予想される最高気温は30°C(86°F)、最低気温は18°C(64.4°F)です。また、最大の暑さ指数(空気温度と相対湿度を組み合わせたもの)は31°C(87.8°F)となっています。
*明日の予報は、大体、曇りか雨とされているので、これは間違いですね。最高気温も高すぎます。

WebPilot 明日、2023年5月20日の東京の天気予報については、気象庁の情報によると、雨が降る可能性が高いようです。具体的な降水確率は80%となっています。また、気温は25度と予想されています。雨具を持って出かけることをおすすめします。
*妥当な内容です。雨具を勧めているところも親しみやすくて、よい回答です。

Bing 明日の東京の天気予報は、Mostly_Cloudyで、最高気温は24度、最低気温は18度です。降水確率は86%で、風速は5m/s、湿度は78%です。日の出は4:33:45 AM、日の入りは6:41:53 PMです。
*一部英語になったり、数値が多すぎたりで、あまり分かりやすい内容ではありません。

Bard 明日の東京の天気予報は、曇りで、時々晴れるでしょう。最高気温は23度、最低気温は17度です。
*短いですが、妥当な内容です。

ChatGPTだけ内容が違っているのはなぜでしょうか。やはり検索の性能に問題があるのかもしれません。

次に、現在のG7首脳の名前について聞いてみます。

入力 現在のG7首脳の名前を教えてください。

ChatGPT 
現在のG7首脳は以下のとおりです:
- カナダ:ジャスティン・トルドー 首相
- フランス:エマニュエル・マクロン 大統領
- ドイツ:オラフ・ショルツ 首相
- イタリア:ジョルジャ・メローニ 首相
- 日本:岸田文雄 首相
- イギリス:リシ・スナック 首相
- アメリカ:ジョー・バイデン 大統領
- ヨーロッパ連合:ウルスラ・フォン・デア・ライエン委員長、シャルル・ミシェル理事会議長
*正解です。

WebPilot
 現在のG7の首脳は以下の通りです:
・アメリカ:ジョー・バイデン(大統領)
・イギリス:ボリス・ジョンソン(首相)
・フランス:エマニュエル・マクロン(大統領)
・ドイツ:オルフ・ショルツ(首相)
・イタリア:マリオ・ドラギ(首相)
・カナダ:ジャスティン・トルドー(首相)
・日本:菅義偉(首相)
なお、欧州連合(EU)はG7に参加していますが、首脳は固定されていません。現在の欧州委員会の委員長はウルスラ・フォン・デア・ライエン、欧州理事会の議長はシャルル・ミシェルです。
*イギリス、イタリア、日本の情報が古いようです。

Bing G7首脳の現在のメンバーは、アメリカ、カナダ、フランス、ドイツ、イタリア、日本、イギリスの7か国です。2023年には日本がG7議長国を務めます。
*首脳の名前を教えてくれなかったので、もう一度「首脳の名前を教えてください。」と聞き直しました。

Bing G7首脳の名前は以下の通りです。
- アメリカ:ジョー・バイデン大統領
- カナダ:ジャスティン・トルドー首相
- フランス:エマニュエル・マクロン大統領
- ドイツ:オラフ・ショルツ首相
- イタリア:ジョルジャ・メローニ首相
- 日本:岸田文雄首相
- イギリス:リシ・スナク首相
*今度は正しく回答してくれました。

Bard G7の現在のリーダーは、2023年1月から議長を務めている日本の岸田文雄首相です。
G7は、カナダ、フランス、ドイツ、イタリア、日本、英国、米国の7か国からなるグループです。世界最大の経済を代表するグループであり、経済、金融、気候変動など、世界で最も差し迫った問題について話し合うために定期的に会合します。
*岸田首相以外の名前を教えてくれなかったので、もう一度聞き直しました。

Bard 現在の G7 首脳は次のとおりです。
* カナダ:ジャスティン・トルドー首相
* フランス:エマニュエル・マクロン大統領
* ドイツ:オラフ・ショルツ首相
* イタリア:マリオ・ドラギ首相
* 日本:岸田文雄首相
* 英国:リシ・スナック首相
* 米国:ジョー・バイデン大統領
* 欧州連合(EU):シャルル・ミシェル欧州理事会議長
*イタリアの情報が古いようです。

以前はなかなかこの質問に正解できないモデルが多かったのですが、最近、サミットの関係で現在の首脳の名前が出ることが増えたため、少し改善されました。

それでも、WebPilotとBardが一部不正解となっています。新旧の情報が入り混じる中で、どの情報が最新なのかをAIが把握することは簡単ではないようです。


4.最新のニュースの検索

入力 最近、Twitterで話題となっているニュースを3つ教えてください。

ChatGPT 最近のTwitterの話題となっているニュースについて調査しました。以下、日本でトレンドとなっている3つのトピックについての情報です:

1. "カナヲちゃん": 人気アニメ『鬼滅の刃』のキャラクター、栗花落カナヲの誕生日(5月19日)を記念して、スペシャルPVやufotable描き下ろしミニキャライラストが公開されたことが話題になっています。

2. "RTX4060": NVIDIAが新製品、GeForce RTX 4060 Familyを発表しました。この新しいグラフィックスカードは、ゲームやクリエイティブなアプリケーションでのパフォーマンスを大幅に向上させるとされています。この製品は5月24日から利用可能となります。

3. "KPレスゲーム": このトピックについては具体的なニュースを見つけることができませんでした。KPレスゲームはおそらく特定のゲームやイベントに関連していると思われますが、具体的な詳細は不明です。

以上の情報は最近のTwitterのトレンドを基にしたものですが、Twitterのトレンドは時間や場所、または特定のイベントにより頻繁に変化します。これらのトピックはあくまで一部の情報であり、全体のトレンドを反映したものではないことをご了承ください。
*沢山のサイトを検索していたようで、回答までにかなり時間がかかりました。因みに「KPレスゲーム」とはクトゥルフTRPGのゲームマスター不要でダイスだけでプレーできるゲームのようです。

WebPilot すみませんが、Twitterのトレンド情報を取得するためにはログインが必要となります。私の能力では直接Twitterにログインすることはできません。しかし、一般的なニュースサイトや他のソーシャルメディアプラットフォームから最新の話題を取得することは可能です。どのように進めましょうか?
*Twitterのトレンド情報にはアクセスできないと回答を断ってきました。

Bing 最近Twitterで話題となっているニュースを3つ教えてほしいとのことですね。以下の3つのニュースが話題になっているようです。

1. 人気アイドルグループ「乃木坂46」のメンバー、齋藤飛鳥さんが、自身のTwitterアカウントで、自身が出演するドラマ「ハコヅメ~たたかう!交番女子~」の最終回に向けて、感謝の気持ちをつづったツイートが話題になっています。

2. 5月14日に行われる「第27回参議院議員通常選挙」に向けて、各党派が続々と公約を発表しています。その中でも、立憲民主党は、消費税率を現在の10%から8%に引き下げることを公約に掲げました。この公約がTwitter上で話題になっています。

3. 5月11日に発表された「第一生命保険株式会社」の2022年度決算は、前年度比で純利益が増加したことが話題になっています。このニュースはTwitter上でも取り上げられています。

それぞれのニュースについてもっと知りたい場合は、リンク先をご覧ください。
※色々と間違っていそうです。ハコヅメは2年前に終わっています。第27回参議院選挙は今年7月の予定。第一生命決算は純利益減のはず。

Bard はい、最近Twitterで話題になっている3つのニュースをご紹介します。

1. ロシアのウクライナ侵攻:ロシアは2月24日、ウクライナに侵攻した。侵攻は国際社会から非難され、多くの国がロシアに制裁を科した。ロシアは侵攻を正当化しておらず、いつ終わるかは不明だ。

2. 中国のゼロコロナ政策:中国はCOVID-19のゼロコロナ政策を継続している。この政策により、上海や北京など中国の主要都市がロックダウンされた。ロックダウンは経済活動に大きな影響を及ぼし、中国の景気減速につながっている。

3. アメリカのインフレ:アメリカは現在、40年ぶりの高インフレに直面している。インフレは、ロシアのウクライナ侵攻や中国のゼロコロナ政策など、さまざまな要因によって引き起こされている。インフレはアメリカ経済に大きな影響を及ぼし、景気後退につながる恐れがある。

これらは、最近Twitterで話題になっているニュースのほんの一例です。Twitterは、世界中の人々がニュースを共有し、議論するためのプラットフォームであり、常に新しいニュースが話題になっています。
※現在も続いている話題が多いですが、どれも内容が古そうです。ロシアのウクライナ侵攻開始は昨年の2月です。中国は既にゼロコロナ政策を転換しました。アメリカのインフレも長く続いていますが、特に話題になったのは昨年です。

こうして見ると、質問にまともに回答できたのはChatGPTのみでした。ChatGPTは、上手く検索できた時とそうでない時の差が激しいようです。

次に、最新のAI関連ニュースをもとにブログ記事を書いてもらいます。長くなるので、ChatGPTのみに書いてもらいました。

入力 最新のAI関連ニュースをもとにブログ記事を書いてください。

以下がChatGPTの回答です。

AIの最新動向:OpenAIの新しい言語モデルとGoogleのAI操作型検索エンジン

私たちの生活のあらゆる側面にAIが浸透していく中で、2つの重要な発表がありました。OpenAIが新しい言語モデルを公開する準備を進めている一方、Googleは新しいAI操作型の検索エンジンを開発しています。

OpenAIの新しい開発

OpenAIのChatGPTは、その驚くべき文章生成能力で広く知られ、多くの投資家が生成型AIをテクノロジー企業の次なる成長領域と見ています。そしてOpenAIは現在、新しいオープンソースの言語モデルの公開を計画しているとの報道があります。

Microsoftは今年初めにOpenAIへの多額の投資を発表し、スタートアップとのつながりを深めると同時に、Googleとの競争を加速させる布石を打ちました。さらに、Meta Platformsは人間のような文章、アート、その他のコンテンツを作り出す能力を持つ生成型AI製品のリリースに向けて急ピッチで準備を進めています。

しかし、OpenAIはGPTと競合するモデルをリリースすることはないと見られています。OpenAIのこの動きは、AI開発の競争がさらに激化することを示しています。

GoogleのAI操作型検索エンジン

一方、GoogleもAIの活用をさらに進めています。同社のCEO、Sundar Pichaiは、今年中にGoogleの製品群のいくつかにAIの存在を拡大する計画を発表しました。その一環として、Googleの検索エンジンに新しいルック&フィールが導入されます。

Googleは、新しいAI操作型検索エンジンを"Search Generative Experience"(SGE)と名付けています。SGEは、質問へのより長く詳細な回答を生成する能力をAIに与えることで、インターネット全体から見つかった情報を統合し、ユーザーが複数の検索を行う手間と時間を節約します。

新しいGoogle検索の違いは何でしょうか? その答えは、ワシントンポストの記者がテストした結果からいくつか洞察を得ることができます:

1. AIは人間らしさを持たず、自己を指す代名詞を使用しません。これは、SnapchatのAIチャットボットが一部のユーザーから「恐ろしい」と評価された事例を避けるための策です。

2. AIはシンプルなGoogle検索を置き換えるものではありません。簡単な質問には簡単な回答があり、AIによる情報の統合は、より特定的な検索に対してのみ行われます。

3. AIは情報源を引用します。AIが情報をまとめる際には、どこから情報を引き出したか、どの情報源を使用したかを表示します。

4. AIは常に正しいわけではありません。例えば、良いチョコレートチップクッキーのレシピを求めても、SGEはチョコレートチップをレシピから忘れてしまうかもしれません。これは、AIが常に正しい答えを出すわけではないこと、そしてまだテスト段階であることを示しています。

Googleは今年後半に一般公開を予定しており、その前にはテストユーザーにSGEを使用する機会を提供する計画です。テストは当初アメリカで行われますが、最終的には全世界の40億人以上のユーザーに提供される予定です。

これらの発表は、AIがどのように進化し、どのように我々の日常生活に影響を与えるかについての洞察を提供しています。AIは依然として発展途上の技術であり、その可能性と限界について学ぶことは、我々がテクノロジーを理解し、それを最大限に活用する上で重要です。

※OpenAIのオープンソースモデルの公開計画とGoogleの AIを組み込んだ新しい検索システムは、どちらも業界で大きな話題になっており、ブログ記事としてセンスの良いテーマ選択だと思います。しかし、欲を言えば、未だ内容が抽象的で、両陣営の戦略など、もう少し深く論点を掘り下げて欲しいと思いました。


5.一覧表の作成

昨年のヒット曲ランキングを作成してもらいました。

入力 2022年に日本でヒットした曲のトップ10ランキングを一覧表にしてください。

ChatGPT 2022年に日本でヒットした曲のトップ10ランキングは以下の通りです:
1. "ツキヨミ / 彩り" - King & Prince
2. "オレンジkiss" - Snow Man
3. "ブラザービート" - Snow Man
4. "好きというのはロックだぜ!" - 乃木坂46
5. "ここにはないもの" - 乃木坂46
6. "I(CALL 119/We Are)" - INI
7. "The Answer/サチアレ" - なにわ男子
8. "Actually..." - 乃木坂46
9. "TraceTrace" - King & Prince
10. "ハッピーサプライズ" - なにわ男子
*オリコンのデータを基に作成されたものであり、正確な内容だと思います。

WebPilotも同じ内容でした。

Bing 2022年に日本でヒットした曲のトップ10ランキングを一覧表にしてみました。以下のリンクから詳細をご確認ください。
| 曲名 | 歌手 |
| 残響散歌 | Aimer |
| W / X / Y | Tani Yuuki |
| ベテルギウス | 優里 |
| ドライフラワー | 優里 |
| シンデレラボーイ | 優里 |
| ミックスナッツ | Official髭男dism |
| 新時代 (ウタ from ONE PIECE FILM RED) | Saucy Dog |

参考文献: [ヒット曲ドットコム](https://hitkyoku.com/archives/reiwa4.html)
*トップ10なのに7曲しかありません。参考サイトも確認しましたが、優里の3曲などは2022年より前に発表されたもので、2022年のヒット曲ランキングとは言えないようです。

Bard はい、2022年に日本でヒットした曲のトップ10は次のとおりです。
1. ドライフラワー - 優里
2. あの夢をなぞって - YOASOBI
3. ハルジオン - YOASOBI
4. 春を告げる - yama
5. 三文小説 - King Gnu
6. 虹 - 菅田将暉
7. 白日 - King Gnu
8. HAPPY BIRTHDAY - back number
9. クリスマスソング - back number
10. たぶん - YOASOBI

これらの曲はすべて、ストリーミングサービスで何百万回も再生され、ヒット曲チャートやテレビ番組や映画のサウンドトラックに登場しました。また、多くのミュージシャンや歌手がカバーしています。
*2022年より前に発表された曲ばかりであり、2022年のヒット曲ランキングとは言えないようです。

指示どおりに昨年のヒット曲ランキングを作成したのは、ChatGPTとWebPilotのみでした。

次に、ChatGPTとBingとBardの性能比較一覧表をChatGPTに作成してもらいました。

入力 ChatGPTとBingとBardの3種類のチャット型 AIの性能比較一覧表を作成してください。

ChatGPT ChatGPT、Bing、Bardの3つのAIの性能比較表を以下に作成します。

この比較表は2023年5月現在の情報を基に作成されています。それぞれのAIの機能は日々進化しているため最新の情報は各AIの公式ウェブサイトや公式ドキュメンテーションで確認してください。なお、ChatGPTについては、私自身がその情報を提供しました。

※現在、ChatGPTもメモリの消去に対応しており、ChatGPTとBingは日本語に対応しています。

内容が正確かどうかを確認する必要はありますが、こうした比較表の作成は、仕事などに活用する場合にとても便利です。


6.URLでの内容の読み取りと要約

URLを示すだけで、そのサイトの内容を読み取ることができるか試してみました。

(1) 日本語記事の要約

入力 以下の記事を要約してください。
https://gigazine.net/news/20230517-openai-ceo-calls-for-laws/


ChatGPT 検索失敗

WebPilot
記事のタイトル: "OpenAIのサム・アルトマンCEOが「AIの規制は不可欠」と発言、公聴会でChatGPTが法案を作成し国会議員たちを驚かす一幕も"

要約:
OpenAIのCEO、サム・アルトマン氏は、公聴会でAIの規制が必要であるとの立場を明確にしました。彼はAIの利点を最大限に引き出す一方で、その潜在的な害を最小限に抑えるために政府の介入が重要だと述べました。具体的には、AIの安全基準の設定、AIの公開前のテストの確立、そして独立した監査人による公開前の検査などを提案しました。また、アルトマン氏は、人々がAI生成のコンテンツを理解し、それを信頼できる情報源として利用するためにも、政府が規制の役割を果たすべきだと強調しました。さらに、彼は既存の規制枠組みがAIに対して不適切であり、新しい枠組みが必要だと主張しました。公聴会では、ChatGPTが法案を作成するデモンストレーションも行われ、議員たちを驚かせました。
*記事の内容をよく理解し、適切にまとめられています。

Bing OpenAIのCEOであるSam Altman氏は、AIの規制が不可欠であると述べ、政府による規制介入が重要であるとの考えを示しました。彼は、AIの利点を伸ばす一方で、AIの害を最小限に抑えるための政府による規制介入が重要であると述べました。

以上の記事を要約すると、OpenAIのCEOであるSam Altman氏は、AIの規制が不可欠であり、政府による規制介入が重要であると述べたことが伝えられています。
*記事の内容は読めているようですが、無駄な繰り返しが多く、要約が上手くできていません。

Bard OpenAIのサム・アルトマンCEOは、米国上院司法委員会の公聴会に出席し、AIの規制の必要性を訴えました。彼は、AIの利点を最大限に引き出し、害を最小限に抑えるために、政府による規制介入が必要であると述べました。また、ChatGPTが法案を作成し、国会議員を驚かせました。
*短いですが、簡潔によくまとめられています。

ChatGPTは、検索が上手くいかず、結局、要約を作成してくれませんでした。

(2) 英語記事の要約

入力 以下の記事を日本語で要約してください。
https://blog.google/technology/developers/google-colab-ai-coding-features/


ChatGPT Google Colabは近く、Googleの最先端のコードモデルファミリーであるCodeyを使用したAIコーディング機能を導入する予定です。2017年以来、Google ColabはPythonでプログラミングを始める最も簡単な方法であり、すでに700万人以上の人々、特に学生がColabを利用して、これらの強力なコンピューティングリソースに無料でアクセスしています。これは、ソフトウェアをインストールしたり管理したりすることなく、機械学習、データ分析、および教育のための優れたツールであり、AIの進歩によりさらに良くなります。Colabは近く、コード補完、自然言語からのコード生成、さらにはコードアシスタントのチャットボットのようなAIコーディング機能を追加する予定です。これは、先週I/Oで発表されたばかりのPaLM 2に基づくコードモデルのファミリー、Codeyを使用します。Codeyは、コーディングタスクのパフォーマンスを向上させるために、外部ソースからの高品質で許可されたコードの大規模なデータセットで微調整されました。さらに、Colabの電源として使用されるCodeyのバージョンは、PythonおよびColab固有の使用のために特別にカスタマイズされています。

Colabのユーザーは、プログラミングの速度、品質、理解を劇的に向上させるCodeyモデルへの最初のアクセスを得る予定です。最初の機能はコード生成に焦点を当てます。自然言語からのコード生成は、コメントやプロンプトから全体の関数を書くのを助け、繰り返しコードの作成の必要性を減らし、より興味深いプログラミングとデータ科学の部分に集中できます。Colabの対象ユーザーは、ノートブックに新しい「生成」ボタンを見ることができ、任意のテキストプロンプトを入力してコードを生成することができます。有料の対象ユーザーは、入力を始めると、自動補完の提案が表示されます。

さらに、私たちはチャットボットの役立つ機能を直接Colabにもたらす。近く、Colabで直接質問をすることができるようになります。たとえば、「Google Sheetsからデータをどのようにインポートするか?」または「Pandas DataFrameをどのようにフィルタリングするか?」などの質問が可能になります。

インターネット接続があれば誰でもColabにアクセスし、無料で使用することができます。毎月何百万人もの学生がPythonプログラミングと機械学習を学ぶためにColabを使用しています。リソースが不足しているグループも、機械学習アプリケーションのための高性能GPUにアクセスできるよう、無料でColabを利用しています。これらの特徴へのアクセスは、次の数ヶ月間で段階的に展開され、まずは米国の有料サブスクライバーから始まり、その後無料の層に拡大します。また、時間とともに他の地理的地域にも展開します。新しいリリースやローンチについてのアナウンスは、Twitterの@googlecolabをフォローしてください。
※要約というには長すぎますが、ちゃんと内容を読み取れています。

WebPilot Google Colabは近く、Googleの最も先進的なコードモデルのファミリーであるCodeyを使用したAIコーディング機能を導入する予定です。2017年以来、Google ColabはPythonでのプログラミングを始める最も簡単な方法であり、学生を含む700万人以上の人々がこれらの強力なコンピューティングリソースに無料でアクセスしています。

新たに追加されるAIコーディング機能には、コード補完、自然言語からのコード生成、さらにはコード支援チャットボットが含まれます。Colabは、先週I/Oで発表されたばかりのPaLM 2に基づいて構築されたコードモデルのファミリーであるCodeyを使用します。Codeyは、コーディングタスクのパフォーマンスを向上させるために、外部ソースからの高品質で許可されたコードの大規模なデータセットで微調整されました。さらに、Colabを動かすために使用されるCodeyのバージョンは、PythonとColab特有の使用法に特化してカスタマイズされています。

また、Colabには直接チャットボットを導入することで、ヘルプが必要な場合に簡単に質問できるようになります。近く、Colab内で直接「Google Sheetsからデータをインポートするにはどうすればいいですか?」や「Pandas DataFrameをフィルタリングするにはどうすればいいですか?」などの質問ができるようになります。

これらの機能は、今後数ヶ月間で段階的に提供される予定で、まずは米国の有料加入者から始まり、その後無料層に拡大されます。さらに時間をかけて他の地域にも拡大される予定です。新しいリリースやローンチについてのアナウンスは、Twitterの@googlecolabをフォローしてください。
※ChatGPTよりは、コンパクトにまとまっています。

Bing 
Google Colabは、Googleが機械学習の教育及び研究用に提供しているインストール不要かつ、すぐにPythonや機械学習・深層学習の環境を整えることが出来る無料のサービスです。この記事では、Google ColabのAIコーディング機能について紹介されています。AIコーディング機能は、コードの自動補完、コードの自動生成、コードの自動修正などを行うことができます。
※AIコーディング機能が新たに導入されることや、コード支援チャットボットが導入されることも書かれておらず、要約として不十分です。

Bard 
はい、Google Colab の新しい AI コーディング機能についてのブログ記事の要約です。2017 年以来、Google Colab は Python でプログラミングを開始する最も簡単な方法です。学生を含む 700 万人以上の人々がすでに Colab を使用して、ソフトウェアをインストールしたり管理したりすることなく、これらの強力なコンピューティングリソースに無料でアクセスしています。
本日、Google は Colab にコード補完、自然言語からコードの生成、さらにはコードを支援するチャットボットなどの AI コーディング機能を追加すると発表しました。
米国の Colab ユーザーは、Colab 内で独自の Codey モデルに最初にアクセスできます。これにより、プログラミングの速度、品質、および理解力が大幅に向上します。
最初の機能は、コード生成に重点を置いています。自然言語からコードの生成を使用すると、より大きなコードブロックを生成できます。コメントまたはプロンプトから関数全体を記述できます。これは、繰り返しのコードを書く必要性を減らし、プログラミングとデータサイエンスのより興味深い部分に集中できるようにすることを目的としています。
これらは、Colab に追加される多くの AI コーディング機能のほんの一部です。Google は、プログラミングをより便利で効率的にするために、この分野で継続的に取り組んでおり、今後もさらに多くの機能を発表する予定です。
※概ねよくまとまっていますが、チャットボット機能や米国以外の地域への拡大についても説明すべきだと思いました。

どのモデルも、サイトの内容の読み取りはできています。要約としては、WebPilotが一番良かったでしょうか。

(3) PDFの読み取りと要約

次は、arXivに掲載されている論文のPDFを読み取ってまとめてもらいます。

入力 以下の論文を読んで、モデルの概要や特徴、他のモデルとの性能比較、課題などについて300字くらいでまとめてください。
https://arxiv.org/pdf/2302.13971.pdf

ChatGPT 検索失敗(PDFファイルは読み込めないようです。)

WebPilot この論文は、新たな深層学習モデル「DeepSpectrum」について述べています。DeepSpectrumは、音声認識タスクにおいて、特に音声と音楽の分類に優れた性能を発揮します。このモデルは、スペクトログラムを入力として受け取り、それを深層ニューラルネットワークに通すことで、音声や音楽の特徴を抽出します。

DeepSpectrumの主な特徴は、その訓練方法と性能です。訓練は、大量の音声と音楽データを用いて行われ、その結果、モデルは高い精度と汎用性を持つようになりました。また、このモデルは、他の既存の音声認識モデルと比較して、一貫して高い性能を示しました。

しかし、DeepSpectrumにはいくつかの課題も存在します。特に、モデルの訓練には大量のデータと計算リソースが必要であり、これが制約となる可能性があります。また、モデルの解釈性についても改善の余地があります。これらの課題を解決するために、著者らはさらなる研究を提案しています。
※この論文は、大規模言語モデルのLLaMAに関する論文であり、全く内容が違います。プラグインの動作内容を見ると、ちゃんとPDFの内容を読み込んでいるようであり、なぜこうした間違いが起こるのかよく分かりません。

Bing 論文「LLaMA: Open and Efficient Foundation Language Models」は、7Bから65Bのパラメータを持つ複数の言語モデルを提供するオープンソースのプロジェクトです。この論文では、公開されているデータセットだけを用いて、GPT-3(175B)を上回る性能を発揮する13Bのモデルが提供されています。また、論文では、従来の手法と同様に、Chinchillaスケーリング則に基づくトレーニングアプローチが採用されていることが述べられています。

ただし、論文には概要や特徴、課題についての記述はありませんでした。また、性能比較については、論文内で他の言語モデルと比較していることがわかりますが、詳細な比較結果については記述されていませんでした。

以上のことから、この論文ではLLaMAプロジェクトについて詳しく紹介されていますが、性能比較や課題については詳細な記述がないことがわかりました。
※PDFの内容は一応読み込めているようです。モデルの概要や特徴、他のモデルとの性能比較や課題についての記述も論文にきちんと書かれており、なぜ記述がないと言うのかは分かりません。

Bard 
はい、こちらが論文「LLaMA:Open and Efficient Foundation Language Models」の要約です。

LLaMAは、70億から650億のパラメータを持つ言語モデルのコレクションです。Facebook AI Researchによって開発されました。このモデルは、公開されているデータセットのみを使用してトレーニングされており、他の大規模な言語モデルと競争できるパフォーマンスを発揮しています。

LLaMAは、Transformerアーキテクチャをベースにしています。このアーキテクチャは、従来のニューラルネットワークよりも長いシーケンスを処理するのに効果的です。LLAMAは、大量のテキストとコードのデータセットでトレーニングされています。これにより、さまざまなタスクを実行することを学習できます。

LLaMAは、他の大規模な言語モデルと比較して、いくつかの利点があります。公開されているデータセットのみを使用してトレーニングされているため、他のモデルほどトレーニングに費用がかかりません。また、単一のGPUで実行できるため、より手頃な価格です。

ただし、LLaMAにはいくつかの課題もあります。他の大規模な言語モデルほど大きくないため、パフォーマンスが劣る場合があります。また、まだ開発中であり、他のモデルほど洗練されていない場合があります。

全体として、LLaMAは、さまざまなタスクを実行できる強力な言語モデルです。まだ開発中ですが、将来有望です。
※論文には、他のモデルと比較しても、高い性能を発揮していることが記述されており、この説明は控えめすぎます。

ChatGPTは、PDFファイルを読み込むことができませんでした。他のモデルは、一応、読み込むことができるようです。要約の内容は、どのモデルも問題がありますが、Bardが一番マシだったように思います。


7.他のChatGPTプラグインとの組み合わせ

ChatGPTでは、最初にWebブラウジングを使うのか、プラグインを使うのか選択するようになっているため、Webブラウジング機能と他のプラグインを組み合わせて使用することはできません

他方、プラグインは同時に3個まで使用することができるため、WebPilotと他のプラグインを組み合わせて使用することは可能です。
以下は、WebPilotで集めたデータを基にして、Wolframでグラフを描いた例です。

大谷選手の昨年のホームラン数は34本であり、この数値は正しくありません。
しかし、筆者がプラグインを使って一番やりたいのは、このようにネットからデータを集めてグラフに表示したり、データ分析を行ったりすることです。
今後、WebPilotなどのWeb検索プラグインの性能が上がることを期待しています。


8.まとめ

どのモデルも一長一短で、順位を付けることは難しいです。
Bingは回答が短く不親切だし、Bardは誤りが多いです。
ChatGPTは、よい時と悪い時に差があって安定せず検索に失敗することが多くて、出力に時間がかかります。
WebPilotもChatGPTと同様に時間がかかり大きく間違った回答を返すことがあります。

いずれにせよ、今後もどんどん新しいプラグインが開発されたり、改善されたりすると思いますので、優れたプラグインが現れることや、既存のモデルやプラグインが改善されることを期待しています。
プラグインの競争が激しくなって、あっと言う間に全部入れ替わってしまうかもしれません。

これまでのAIの発展を考えれば、短期間でWebブラウジング機能が大幅にレベルアップしたとしても、誰も驚きません。
その時は、いくつかのプラグインを組み合わせて、これまで予想もしなかった高度なタスクがこなせるようになっているでしょう。


この記事が気に入ったらサポートをしてみませんか?