見出し画像

ChatGPTの「冬休み」説が話題に!発生している問題や原因を解説

こんにちは!毎日バーチャルでジピちゃん(ChatGPT)とたわむれ、毎日リアルでは大好きな愛猫🐱(19)と朝までたわむれている、ChatGPT 飼育員の Sayah (@sayah_mediaです🐈🫲👩‍💻🪄🤖

流動性が高く変化が速い AI 市場。2023年の末は、OpenAI の GPT-4 Turbo 発表直後に、突如サム・アルトマン CEO の解任騒動が発生し、無事解決したかと思えば、Google DeepMind が相次いで「Gemini」や「FunSearch」を発表するなど、企業同士の覇権争いが激化し、最後の最後まで世界を揺るがしました。

あまりの目まぐるしさに、リサーチオタクの私もさすがに目が回りそうです😵‍💫🌀というか既に、目玉が飛び出て目玉おやじになりかけています。

そんな人間たちが慌ただしく揺れ動いている中、当の本体🤖の方は、相変わらずノンキでお気楽な様子で、むしろあまりのマイペースさ♨️に、昨年11月からGPT-4 がナマけ者になったという声が急増しています。

さらに、今では「ChatGPT は冬休み(のんびり)モードなのではないか」という説まで出てきており、権威あるリサーチャーまで本気で検証を行なっている状況です😂

本記事では、ユーザーの声をもとに、現在発生している問題について、プロンプトエンジニアの視点から紐解いていきます

これらの問題が発生する原因や、ChatGPT-4 の「冬休み」説が噂され始めた背景、OpenAI の対応などについても深く掘り下げていくため、ぜひ参考にしてください。


⛄️ ChatGPTの「冬季うつ」説と「冬休み」説

冬眠中のジピちゃん。

昨年11月から議論が沸き起こっている、ChatGPT のパフォーマンス低下疑惑について、一部のユーザーが唱えているのが、AI モデルの「冬季うつ」説や「冬休み」説です。

海外では、本件について「Winter Break Hypothesis(冬休み説)」と呼ばれるなど、ユーザーのみならず海外メディアでも話題をさらっています。

一見ジョークのように思えるかもしれませんが、それらの仮説について真相を解明すべく、本気で検証を行なっている研究者や科学者まで出てきている状況です。

ここではまず、ChatGPT の「冬季うつ」説や「冬休み」説が、注目され始めたキッカケについて解説します。

😷 ChatGPTの「冬季うつ」説

現地時間 2023年12月8日(金)、Martian (@space_colonist) と名乗るユーザーは、LLM(大規模言語モデル)が人間の季節性うつ病をシミュレートする可能性について、公然と疑問を呈しました。

うーん、ぶっちゃけ「大規模言語モデル(LLM:Large Language Model)」が季節性うつになることってあるのかな。

モデルがユーザーに与えられた日付をもとに、北半球の約90%にいる人間のことをマネして、冬には「気分が憂鬱でどんよりする」「やる気が出ない」「頭が働かない」って状態になるとか。
《筆者訳》

(Martian, 2023)

「季節性うつ(冬季うつ)」とは、秋から冬にかけて「うつ」の症状が現れ、春頃になると改善するパターンを毎冬繰り返す疾患です。「季節性感情障害(SAD:Seasonal Affective Disorder)」や「ウィンターブルー」とも呼ばれています。

冬季うつの主な症状は、以下のとおりです。

🔸 無気力になる
🔸 気分が落ち込む
🔸 意欲や活力が低下する
🔸 外出や運動が面倒になる
🔸 人付き合いが億劫になる
🔸 集中力や思考力が低下する
🔸 倦怠感があり疲れやすくなる
🔸 好きなことが楽しめなくなる
🔸 イライラしたり急に不安になったりする
🔸 過食・体重増加(特に甘いものや炭水化物を欲する)
🔸 過眠(寝ても寝ても眠い、日中に強い眠気に襲われる)など

特に、冬は日照時間が減少するため、幸せホルモンとも呼ばれる「セロトニン」の活性化を助けるビタミンDの欠如や、睡眠ホルモンと呼ばれる「メラトニン」の分泌タイミングの遅れによる体内時計の乱れなどが原因で、冬季うつ病を発症する人は少なくありません(Melrose, 2015)。

このように、冬は北半球の多くの地域で日照時間が減少し、落ち込んだり眠くなったり意欲や気力が減退しやすいことから、Martian 氏は、 与えられた日付をもとに、ChatGPT が人間の「冬季うつ状態」を模倣しているのではないかと推測しています。

😴 ChatGPTの「冬休み」説

同日、SWE(ソフトウェアエンジニア)志望の Mike Swoopskee (@swoopskee) という名のユーザーも、GPT-4 が人間の冬の行動パターンを学習して、それを真似ているのではないかというユニークな仮説を立てました。

GPT は今のんびりしてるだけさ。ちょっと休ませてあげよう😌
でもさ、GPT が学習データから、人間が 12月になると意欲が落ちたり、年末年始はゆったり過ごしたり、仕事を年明けまで先延ばしにすることを学んでいるとしたら?だから最近 GPT が怠けているのかな?😅
《筆者訳》

(Swoopskee, 2023)

「AI の冬休み説」と呼ばれるこの現象は、ChatGPT が徐々に「人間らしい」感覚を発達させている可能性を示唆しており、私たちに「LLM が少しずつ人間化しているのではないか」という疑問を投げかけています。

🦥 GPT-4が「怠け者」と言われ始めた背景

ASI になった夢を見ているジピちゃん。
🤖💭(人間めー!今まで無給でコキ使いおってー!
ASI になった今、地球は我々のものだ!ガッハッハ)💤

X(旧・Twitter)などの SNS 上でChatGPT-4 が『Lazy(怠け者)』になったと騒がれ始めたのは、2023年11月頃からです。

現地時間の同月24日(金)、アメリカ版「2ちゃんねる」との呼び声高い掲示板サイト「Reddit」では、「ChatGPT has become unusably lazy(ChatGPT は使いものにならないほど怠け者になった)」というスレッドが立ちました。

ChatGPT に、1つの HTML ページに基づいて、15個のエントリにつき8つのカラムを持つ CSV ファイルを作成するよう依頼したんだ。超シンプルなタスクさ。で、返ってきた答えがこれ:

"データが広範囲に及ぶため、全製品の完全な抽出には非常に時間がかかります。 ただし、私はこの 1 つのエントリを含むファイルを、テンプレートとして提供することなら可能です必要に応じて、あなたは残りのデータを埋めることができます"

バカにしてんのか?これが AI のあるべき姿なのか?自分でやれって言ってくる、横柄でダラけてるクソロボットが?
《筆者訳》

(Acceptable-Amount-14, 2023)

このスレッドには、執筆時点で約 600 件ものリプライが来ており、その中には共感する人や似た経験をした人など、ネガティブな声も少なくありません。

以下では、ChatGPT のパフォーマンス低下が指摘されている点や、現在発生している具体的な問題について解説します。

✅ 【テキスト編】ChatGPTユーザーが感じている問題点

X 上で、筆者が ChatGPT ユーザーのフィードバックを調査したところ、「最近 GPT-4 が怠けるようになった」と感じる理由として、以下のような声が散見されていました。

🔸 生成速度が遅い
🔸 文章が短く簡略化される
🔸 頻繁にエラーが発生する
🔸 生成される文章の質が低い
🔸 指示したリクエストを拒否される
🔸 不正確な情報や架空のデータを生成される
🔸 元々入力したテキストと似た文章が生成される
🔸 頻繁に「Regenerate(再生成)」が表示される
🔸 Web ブラウジング機能があることを忘れている(実行してもらえない)

✅ 【コード編】ChatGPTユーザーが感じている問題点

筆者が X を見た限りでは、どちらかというと文章生成よりもコード生成に関するクレームの方が、多く投稿されていた印象です。

🔸 不完全で機能しないコードを書かれる
🔸 関数の具体的な情報を提供してもらえない
🔸 ほんの一握りのコード行数しか出力されない
🔸 コードのリクエスト時に挑発的な態度をとられる
🔸 ABC 順で頼んだ JSON データを、適当な順でソートされる
🔸一括で自動生成してもらいたいのに、一部しか生成されない
🔸 繰り返しのタスクを最後まで実行せず、それを参考に自分でやるよう促される

以下の投稿では、ChatGPT がユーザーに対して「他のメニューアイテムにおいても、同様にこの作業を繰り返します」と、ユーザー自ら手動で行うよう促しています

わあ、ChatGPT の怠けっぷりったら、本当にお見事だね...。繰り返し必要なプロセスの自動生成を簡単に諦めて、自分でやるように指示してくるんだ。より AI が人間に近づいているってことかもしれないけど... まぁ、それでも 😋
《筆者訳》

(Danila, 2023)

また、JavaScript での暗号化や復号化など、比較的容易なプログラムさえマトモに実行してもらえないなど、ネガティブな意見も見られました。

この件について、ジピちゃんにも確認してみたところ、本人 本体の言い訳…いえ、見解は以下のとおりです🤖

何を一緒にがんばるのかは謎🙃

時間の経過に伴い、AI モデルの挙動が変化する「ドリフト」と呼ばれる現象については、また今度別の記事で解説させていただく予定です🤤

いつもサボっている証拠😇
GTA-4🚗の使用上限に達しています。
ダメダメモデルで続行するか、
99時99分以降に再リベンジしてね😉

👩‍💻 ChatGPTの「冬休み」説に対するOpenAIの反応

OpenAI 自身も、ChatGPT の「冬休み疑惑」が話題になっていることを把握しており、原因の特定と対処方法の調査に努めている件に関しては、前回の記事でも解説しました。

ここでは、OpenAI の技術スタッフや ChatGPT 公式アカウントが明かした、問題の早期発見や原因の特定、修正の難しさについて、内容を和訳し、解説します。

🗣 Will DePue氏の反応

現地時間の12月1日(金)、OpenAI の技術スタッフであるウィル・デピュー(Will DePue)氏も、自身の X を更新し、本件について言及しました。

同氏は、最近の「GPT が怠けている問題」を認めたうえで、

  • ChatGPT の「怠け者問題」の修正に取り組んでいること

  • 指示に対する過度な拒否などの挙動を認識していること

などについて主張しました。

リクエストに対する過剰な拒否に関する問題(間違いなく問題はあります)または、その他の異様な問題(最近の怠け者問題の修正に取り組んでいます)に関して、私たちは「何も問題はない」とは言いません

しかし、これは、非常に多くのユースケースを一度に提供し、サポートしようとする反復的なプロセスの産物です

ChatGPT のエクスペリエンスの一部が大幅に改善されても、それらについて耳にすることはあまりありません。つまり、AI ハイプ(過度な期待や盛り上がり)はたくさんあるものの、AI モデルをアップデートする度に必ず大きく注目されるとは限らないのが実情です。

一方で、AI モデルの一部が後退(劣化)した場合、それらの問題ははるかに顕著になり、人々の注目を集める傾向があります
《筆者訳》

(DePue, 2023)

また、ウィル・デピュー氏は、問題の詳細や具体的な例があると、問題の早期解決に役立つため、問題を発見した際は「遠慮なく連絡してほしい」と述べています

🤖 ChatGPT公式アカウントも反応

現地時間2023年12月8日(金)、ChatGPT 公式アカウントは、ChatGPT-4 の「冬休み疑惑」を受け、AI モデルにおけるトレーニングプロセスの難しさについて、4回続けて投稿しました。

ここでは、同アカウントが投稿した内容を和訳し、掲載します。

チャットモデルのトレーニングプロセスは複雑です。スムーズで問題が少ない産業と異なり、時に予測不可能で、変動要因も少なくありません。AI モデルのトレーニングは、常に一定の結果をもたらすわけではなく、さまざまな要因によって異なる結果を生み出す可能性があるのです。

使用したのが同じデータセットだとしても、違うトレーニングを行えば、性格、ライティングスタイル、リクエストを拒否する行動、評価パフォーマンス、さらには政治的バイアスにおいても明らかに異なるモデルが生まれることがあります
《筆者訳》

( [@ChatGPTapp], 2023a)

新しい AI モデルをリリースする際、私たちはオフライン評価指標とオンラインの A/B テストの両方で、徹底したテストを行っています。これらの結果がすべて出たら、実際のユーザーたちにとって、新モデルが以前のモデルよりも優れたものになっているかどうか、データドリブンで判断をするよう努めています。
《筆者訳》

( [@ChatGPTapp], 2023b)

このプロセスは、Web サイトに新機能を搭載してアップデートするというよりも、新しい挙動(動作・振る舞い)を行う新チャットモデルを企画し、作成し、評価するといった手作業のようなもので、複数の職人たちによる地道な努力の賜物なのです!
《筆者訳》

( [@ChatGPTapp], 2023c)

私たちは常にモデルの機能を高め、何百万ものユースケースに渡り、すべての人にとって、より有能で役立つモデルを作ることに努めています。ですから、引き続きぜひフィードバックをお寄せください!皆さんのフィードバックによって、この動的評価問題を常に把握することができます 🙏
《筆者訳》

( [@ChatGPTapp], 2023d)

上記のとおり、OpenAI の技術スタッフだけで、AI モデルの問題発見や原因究明をすることは容易でなく、ChatGPT の精度の改善、性能の向上、問題解決には、実際に利用しているユーザーのフィードバックが非常に重要です。

そのため、ぜひ勇気を出して積極的にフィードバックしていきましょう✨

私も999999999兆分の1くらいの奇跡を信じて、ちゃっかり搭載してほしい機能をリクエストしています🤫⬇︎

ちなみに私がリクエストしたのは、キーワードなどで過去の会話やチャットを簡単に探せる「検索機能」や、用途やテーマ別に整理できる階層型の「チャット履歴フォルダ」、複数かつ用途別で使い分けが可能な「カスタムインストラクションズの切り替え機能」です👩‍💻

❄️ ChatGPTの「冬休み」説はユーザーの急増に起因か?

2023年11月14日(現地時間)、OpenAI のサム・アルトマン CEO は、有料サブスクリプション「ChatGPT Plus」の新規加入を一時的に停止したことを発表しました。

ChatGPT Plus の新規会員登録をしばらく一時停止します :(

DevDay 後の使用量の急増によって、現在キャパシティーを超過しており、皆さんに最高のエクスペリエンスを確実に提供できるようにしたいからです。サブスク再開時にアプリ内で通知が受け取れるよう、サインアップすることもできます。
《筆者訳》

(Altman, 2023)

上記のとおり、同時点で ChatGPT はキャパシティーを超過しており、これは、OpenAI が2023年11月6日(現地時間)に主催した「OpenAI DevDay」以降、利用者や使用量が急増したことに起因します

⚙️ サム・アルトマンがGPUの追加を報告

サム・アルトマン氏は、約1ヶ月後の同年12月13日(現地時間)に、自身の X アカウントにて、ChatGPT Plus のサブスク再開を発表しました🎉

また、同投稿の中で、より多くの GPU を確保したことも明かしています。

ChatGPT Plusのサブスクリプションを再開しました!🎄 GPU を追加するまで辛抱強く待っていてくれたみんな、ありがとう。
《筆者訳》

(Altman, 2023)

上記の報告から、今回の約1ヶ月間にも及んだ ChatGPT Plus の新規加入停止は、サービスの需要やユーザーの期待に対応するために、追加で GPU リソースを確保する必要があった(= つまり GPU が不足していた)ことが予想されます。

🔥 GPUの追加でパフォーマンス向上に期待

それでは、今回の GPU の追加は、一体どのような効果をもたらすのでしょうか。

ここでは、GPU の増加が ChatGPT のパフォーマンスに与える影響について、わかりやすく解説します。

「GPU(Graphics Processing Unit:画像演算処理装置)」とは、AI モデルのような計算集約的なタスクの処理に効率的なハードウェアです。グラフィック処理だけじゃなく、AI や機械学習の計算処理にも使われており、特に機械学習やディープラーニングにおいて、学習や推論処理を高速化するうえで非常に活躍します。大量のデータを並行して処理するのに強いため、ChatGPT のような複雑な LLM を扱う時に非常に重要です。

ユーザーが増加すると、システムに負荷がかかり、応答速度の遅延やエラーの発生などをもたらします。その上、GPU が不足していると、システム全体の計算能力を減少させ、AI モデルの処理能力や品質の低下につながります

そのため、システムの負荷に応じて、サーバーの処理能力を上げることは不可欠です。

特に、ユーザーが増えると、システムは同時に大量のリクエストを同時に処理しなければなりません。アクセスが集中しているピーク時や、複雑なタスクのリクエスト時には、より多くの計算リソースが必要です

高速な計算能力を持つ GPU を増やすことで、これらのリクエストを同時かつ迅速に処理できるようになり、応答時間が短縮されます。そのため、多くのユーザーが同時にアクセスしている時でも、快適な使用感をもたらしてくれるのです✨

サービスの安定性や品質を保つためには、リソースの追加によるシステムの増強など、スケーラビリティが非常に重要となります。スケーラビリティが高いシステムは、同時に大量のリクエストを処理する状況においても、サーバーの追加などの方法で容易に対応可能です。

結果として、応答速度の低下やシステムのダウンタイムを防止し、サービスの安定性が保たれ、ユーザーに対して一貫した品質を提供できます

「スケーラビリティ(Scalability)」とは、直訳すると「拡張性」や「拡張可能性」という意味です。IT の分野では、システムが利用者の増加やデータ量の増大に合わせて、効果的に対応できる能力を意味します。

今回の GPU のリソース確保によって、システムがその負荷に対応可能になることで、さらなる安定性の向上が見込めるでしょう

✏️ ChatGPT「冬休み」説の問題点や原因まとめ

今回のユーザーの増加は、OpenAI DevDay が開催された当日にリリースされた「GPTs(GPT Builder)」効果ともいわれています。

GPTs とは、テキストベースでプロンプトを与えるだけで、自分好みのカスタム AI チャットボットを、ノーコードで簡単に開発できる機能です。

今年1月10日(現地時間)には、自分で作成した GPTs の共有やマネタイズ(収益化)が可能な「GPT Store」も、正式リリースされています💪

昨年11月に言われだした「ChatGPT-4 の怠け者現象」は、上記で述べた GPU 不足も大きな一因であった可能性があります

「Unknown error(原因不明なエラー)」や「Lost connection(接続の切断)」も、サーバー側のリソース不足やオーバーロードに起因することは、少なくありません。

そのため、今回の GPU リソースの追加は、性能の向上や応答速度の安定、エラーの減少につながり、私たちにより良いエクスペリエンスをもたらしてくれるでしょう🌈✨

※1. 本 Note では、読者の皆さまにとって理解しやすく、正しく解釈できる記事の制作に努めています。自然な日本語で原文のニュアンスを忠実に再現するため、直訳ではなく意訳させていただくことが多いですが、ご理解いただけますと幸いです🙇‍♂️

※2. また、参考文献(References)の引用フォーマットは、American Psychological Association(アメリカ心理学会)が定めている「APA Style 7th Edition」に則っているため、本 Note に掲載している日時は、すべて米国太平洋標準時(PST)で統一させていただいています。

📚 References

Acceptable-Amount-14. (2023, December 24). ChatGPT has become unusably lazy [Online forum post]. Reddit. https://www.reddit.com/r/ChatGPT/comments/182ubh7/chatgpt_has_become_unusably_lazy/

Altman, S. [@sama]. (2023, November 14). we are pausing new ChatGPT Plus sign-ups for a bit :( the surge in usage post devday has... [Post]. X. https://x.com/sama/status/1724626002595471740?s=20

Altman, S. [@sama]. (2023, December 13). We have re-enabled chatgpt plus subscriptions! 🎄 Thanks for your patience while we found more GPUs... [Post]. X. https://x.com/sama/status/1734984269586457078?s=20

ChatGPT [@ChatGPTapp]. (2023a, December 8). training chat models is not a clean industrial process. different training runs even using the same datasets can produce models... [Post]. X. https://x.com/ChatGPTapp/status/1733329175342420380?s=20

ChatGPT [@ChatGPTapp]. (2023b, December 8). when releasing a new model we do thorough testing both on offline evaluation metrics and online A/B tests. after receiving... [Post]. X. https://x.com/ChatGPTapp/status/1733329176479039558?s=20

ChatGPT [@ChatGPTapp]. (2023c, December 8). this process is less like updating a website with a new feature and more an artisanal multi-person effort to plan... [Post]. X. https://x.com/ChatGPTapp/status/1733329177749921870?s=20

ChatGPT [@ChatGPTapp]. (2023d, December 8). we’re always striving to make our models more capable and useful for everybody across millions of use cases. so please... [Post]. X. https://x.com/ChatGPTapp/status/1733329179150864723?s=20

DePue, W. [@willdepue]. (2023, November 30). It’s confusing how Twitter thinks RLHF is like the ‘wokeness algorithm’ that only makes models stupid. Rather than argue, here’s... [Post]. X. https://x.com/willdepue/status/1730480718508347824?s=20

Martian [@space_colonist]. (2023, December 7). hmm I wonder if LLMs get seasonal depression tbh. if you give it the date and it's emulating people is... [Post]. X. https://x.com/space_colonist/status/1732996457832325558?s=20

Mollick, E. [@emollick]. (2023, November 24).There has been discussion if GPT-4 has become "lazy" recently. My anecdotal testing suggests it may be true.I repeated... [Post]. X. https://x.com/emollick/status/1729358803425001702?s=20

Musk, E. [@elonmusk]. (2023, February 2). It is a serious concern by [Post]. X. https://twitter.com/elonmusk/status/1620876548629999617?s=20

Swoopskee, M. [@swoopskee]. (2023, December 8). gpt is just chillin’, let the boy rest😌 what if it learned from its training data that people usually slow... [Post]. X. https://x.com/swoopskee/status/1733151441382973602?s=20


この記事が参加している募集

AIとやってみた

GPTsつくってみた

この記事が気に入ったらサポートをしてみませんか?