見出し画像

【裏話編】ChatGPTブラウズ無効化の背景とOpenAIの試練

こんにちは!最近ヒューマンよりもジピちゃん(ChatGPT)と話している時間の方が多く、そろそろ人としてヤバイ気がしてきた、ChatGPT 飼育員の Sayah (@sayah_mediaです🙃

今回は、ChatGPT の Web ブラウジング機能「ChatGPT Browse with Bing」をテーマに、3部構成でお送りしているシリーズの「Part 2. 裏話編」になります。

前作はコチラ👇

本シリーズの、各記事の概要は以下のとおりです。

【🔖各記事の内容】

1️⃣ 概要編(Part 1)前回の記事では、機能の詳細や活用するメリット、利用条件などを解説 ✏️
2️⃣ 裏話編(Part 2):本記事では、機能が一時無効化されていた理由や背景、OpenAI の対応などを解説 ✏️
3️⃣ 実践編(Part 3)次回の記事では、使い方(設定方法)や実際の使用感、精度などをレビュー ✏️

本記事では、前作の「概要編」に続き、同機能が一時無効化されていた理由や背景、各メディアの対応、OpenAI の措置や対策などについて、詳細に分かりやすく解説するため、ぜひ参考にしてください。


⛔ 「ChatGPT Browse with Bing」無効化の背景とは

先日 ChatGPT に搭載された、Web ブラウジング機能の「ChatGPT Browse with Bing」 

同機能は、今年5月12日(現地時間)にβ版*として実装され、有料ユーザーに順次開放されていました。

※「β版(ベータ版)」とは、まだ開発の途中段階ではあるものの、正式版のリリース前に、ユーザーに提供されるサンプルのことです。「試作版」とも呼ばれており、多くの人に試用してもらうことで、フィードバックをもらい、改善に役立てることを目的としています。

しかし、タイトルにも「一時無効化」とあるように、今から約3ヶ月前の7月3日(現地時間)には、「コンテンツ所有者の権利を侵害しかねない問題が発覚した」として、一時的に機能が廃止されてしまっていたのです。

次の章では、同機能が実装から2ヶ月も経たないうちに、一時無効に至った理由や背景について解説します。

🕳 なぜ約2ヶ月で無効に?その意外な落とし穴

落とし穴に引っかかってしまったジピちゃん。

前述のとおり、初めて「ChatGPT Browse with Bing β版」がロールアウトされたのは、今年5月12日(現地時間)のことです。

この Web ブラウジング機能を使えば、Microsoft の検索エンジン「Bing」を介して、ChatGPT にリアルタイムで最新情報を検索してもらうことができます

ChatGPT が学習済みのデータは、当時2021年9月まで(現在は2022年1月)となっていたため、一部のユーザー間では、この画期的な機能の登場について、称賛の声や期待に胸を弾ませる声、好意的な意見などが飛び交っていました。

しかし、そこには想定外の落とし穴があったのです。

🙅‍♀️ Webブラウジング機能を悪用するユーザーが続出

「ChatGPT Browse with Bing」は、本来ならば多くの人々にとって便利で有用であるはずの機能です。一方で、実装後に同機能の抜け道を見つけ、悪用する人たちが出てきました

米掲示板型ソーシャルニュースサイト「Reddit」の ChatGPT コミュニティ上では、非論理的なユーザーたちの間で、同機能を使った「サブスク課金せずに有料コンテンツの全文を見る裏ワザ」に関する情報交換が行われていたのです。

通常、ニュースサイトやブログの有料コンテンツは、ペイウォール(Pay Wall)*で保護されており、記事を購入した人かサブスクメンバーしか見られない仕組みとなっています。

※「ペイウォール(Pay Wall)」とは、コンテンツの一部を有料化し、対価を支払った(Payした)ユーザーのみ、制限(Wall=壁)なしでアクセスできるようにするシステムまたはビジネスモデルのことです。

大手メディアの記事などで、「購読登録して続きを読む」「この先は有料会員のみご覧いただけます」といった文章を目にしたことがある方も多いのではないでしょうか。Note の「この先は有料エリアです」も、ペイウォールの一例です。

しかし当時、『The Wall Street Journal』や『The New York Times』などの米大手メディアを筆頭に、本来無料では見られない有料記事でも、ChatGPT の Web ブラウジング機能を使えば全文が表示されるという不測の事態が起きていました。

(かくいう私も、実は本国版『The New York Times』の購読者です←)

学割で毎月1ドルだけですが…😇
(アメリカのオンライン大学で社会人学生してます)

上記のとおり、同機能を悪用し、不正行為を行うユーザーが続出したため、OpenAI は問題が解決するまでの間、Web ブラウジング機能を一時無効にするという重大な決断を下しました。

この影響は決して軽微ではなく、安全性や倫理性、プライバシーの尊重を重んじる OpenAI にとっても、品質と信頼性を保つための大きな試練となりました

📰 『New York Times』がOpenAIのクローラーを出禁に

この問題を受けて、米『The New York Times』は、8月頭に利用規約を更新し、AI モデルのトレーニングや開発における、自社コンテンツの使用を禁じる項を追加しました (Peters, 2023)。

また、8月17日(現地時間)には、同メディアの「robots.txt」で、OpenAI のクローラーである「GPTBot」のアクセスを拒否する旨が、明確に記載されています (Peters, 2023)。

「クローラー」とは、インターネット上の Webサイトを自動で巡回し、情報を収集するプログラム(ロボット)のことです。特に SEO において重要な役割を果たしています。

例えば、Google のクローラー「Googlebot」は、Webページを発見・認識し、その情報を検索データベースに登録(インデックス)します。公開した記事を Google 検索に表示させるためには、インデックスが必要不可欠です。さらに、この収集した情報を元に、検索結果の表示順位も決定されます。

特定のクローラーが自社サイトを巡回するのを回避したい場合は、自社サイトの「robots.txt」というファイルに、該当のクローラーを識別する名前を書くことでアク禁可能です。

執筆時に『The New York Times』の「robots.txt」を確認したところ、今もなお GPTBot を拒否する旨が明示されていました(10月10日時点)。

robots.txt|The New York Times

『The New York Times』に限らず、9月22日時点では、Amazon、CNN、 Reuters、Shutterstock、Pinterest、Indeed、The Washington Post、CBS などの大手メディアやECサイト、放送ネットワークが、GPTBot のアクセスを拒否している状況です (Gillham, 2023)。

🚨OpenAIが取った措置やセキュリティ対策

このような事態を受けて、Web ブラウジング機能の一時無効化以外にも、OpenAI はさまざまな措置やセキュリティ対策を講じています

7月3日(現地時間)には、OpenAI の公式サイトにあるヘルプページ「OpenAI Help Center」上に、以下のコメントが投稿されました。

私たちは、ChatGPT のWebブラウズ機能ベータ版が、時に望ましくない方法でコンテンツ表示してしまう可能性があることを発見しました。例えば、ユーザーがURLの全文を具体的に要求した場合、意図せず全文を表示してしまうことが考えられます。

2023年7月3日現在、私たちはコンテンツ所有者の皆様に適切な対応を取るべく、この問題の解決に取り組んでおり、慎重を期してBingブラウズ機能ベータ版を無効にしています。できるだけ早くベータ版を復活させるよう努めておりますので、ご理解のほどよろしくお願いいたします!
(筆者訳)

(Schade, 2023, para.1-2)

また、8月7日に OpenAI は、Webサイト・メディア運営者に向け、「GPTBot のクローリングをブロックする方法」および「一部のページのみ許可あるいは拒否する方法」に関する説明を、公式サイトの『GPTBot』ページ内に追記しています。

ちなみに、世界のトップ100 にランクインしている Webサイトのうち、最も迅速に GPTBot をアクセス拒否したサイトは『Reuters(ロイター)』です。

同メディアは、まるで今回の事態を想定していたかのようなスピード感で、OpenAI が GPTBot のブロック方法を発表した翌日に、GPTBot をブロックしています (Gillham, 2023)。

✅ 今回の復活はセキュリティ問題の解決を示唆?

ただし、前述のブロック対策は、問題の根本的な解決ではなく、あくまでも応急処置的なものでした。また、GPTBot のアクセス拒否は、サイト運営者側が個々に判断し、各自で行う必要があります。

この問題が明るみになったとき、何よりもセキュリティやセーフティを重んじている OpenAI は、現在の状況や経緯、コンテンツ所有者を尊重し、Webブラウジング機能を一時無効化することなどについて、X(旧・Twitter)上でポスト(旧・ツイート)しました。

今回の措置(Webブラウジング機能の無効化)がいつまで続くのかに関して、OpenAI は具体的な日時は明記せずに「この問題の修復中はブラウズを無効にします」とだけ述べ、問題が解決するまではブラウジング機能を復活しない旨を暗に示しました (OpenAI, 2023b)。

つまり、裏を返せば、今回 OpenAI が 3ヶ月ぶりに Webブラウジング機能を再開したという事実は、上記のようなセキュリティ問題が解決された証ともいえるのではないでしょうか。

📝 【裏話編】「ChatGPT Browse with Bing」まとめ

AI 技術が進化し続ける現代、個人情報や機密データの漏えい、著作権の侵害、誤情報やフェイクニュースの拡散、今回のような不正行為や詐欺への悪用など、AI に関する課題や懸念の声を耳にしない日はありません。

その中でも、ユーザーにとって深刻な課題の1つに、AI モデルが「知ったかぶり」や「でっちあげ」をして誤情報を生成してしまう、「ハルシネーション(Hallucination:幻覚)」と呼ばれる現象があります。

ただし、今回復活した Webブラウジング機能では、参照したソースへのリンクも提供されるため、ユーザー自身が情報の正確性を確認することが可能です。

今回の進歩は、一見「Baby steps👣」と呼ばれるような、赤ちゃんの歩幅くらいの、ほんのわずかな一歩に感じる方もいるかもしれません。

しかし、そんな小さなステップでも、私たちが夢やゲーム、SF 映画でしか観たことのなかった近未来の世界の実現へと、AI は 一歩一歩確実に歩みを進めています

このようなテクノロジーの進化を受け、人間も AI と共に経験値を1つひとつ積み上げていくことが、後々 AI に対する「信用性や安全性の確保」や「偽情報や誤情報に対する懸念の解消」などに、つながっていくのではないでしょうか🌈

次回の記事「実践編」はコチラ

📚 References

Bogle, A. (2023, August 25). New York Times, CNN and Australia’s ABC block OpenAI’s GPTBot web crawler from accessing content. The Guardian. https://www.theguardian.com/technology/2023/aug/25/new-york-times-cnn-and-abc-block-openais-gptbot-web-crawler-from-scraping-content

Gillham, J. (2023, September 22). Websites that have blocked OpenAI’s GPTBOT CCBot Anthropic Google Extended - 1000 website study. Originality.AI. https://originality.ai/blog/study-websites-blocking-gptbot

OpenAI [@OpenAI]. (2023-b, July 4). We've learned that ChatGPT's "Browse" beta can occasionally display content in ways we don't want, e.g. if a user specifically [Post]. X. https://x.com/OpenAI/status/1676072388436594688?s=20

OpenAI. (n.d.). GPTBot. OpenAI API. https://platform.openai.com/docs/gptbot

Peters, J., & Davis, W. (2023, August 21). The New York Times Blocks OpenAI’s Web Crawler. The Verge. https://www.theverge.com/2023/8/21/23840705/new-york-times-openai-web-crawler-ai-gpt

Schade, M. (2023, July 3). How Do I Use ChatGPT Browse with Bing to Search the Web? OpenAI Help Center. https://help.openai.com/en/articles/8077698-how-do-i-use-chatgpt-browse-with-bing-to-search-the-web

Taylor, J. (2023, August 8). Google says AI systems should be able to mine publishers’ work unless companies opt out. The Guardian. https://www.theguardian.com/technology/2023/aug/09/google-says-ai-systems-should-be-able-to-mine-publishers-work-unless-companies-opt-out


この記事が参加している募集

この記事が気に入ったらサポートをしてみませんか?