見出し画像

日々の壁打ち:ChatGPT o1-previewの思考プロセスに、MAGI Systemをみる想いがした

September 12, 2024

Introducing OpenAI o1-preview
A new series of reasoning models for solving hard problems. Available starting 9.12

We've developed a new series of AI models designed to spend more time thinking before they respond. They can reason through complex tasks and solve harder problems than previous models in science, coding, and math.

Today, we are releasing the first of this series in ChatGPT and our API. This is a preview and we expect regular updates and improvements. Alongside this release, we’re also including evaluations for the next update, currently in development.
2024/9/12、OpenAIの新しいGPTモデル、o1-previewが公開された。

はじめに:ChatGPT o1-previewを使ってみた

上のnote記事は、Bloombergが毎朝伝える米国市場市況記事を、毎日GPTsが分析した結果を1週間分収集し、さらに週間分析のためのステップインストラクションに基づいてGPTsが作成した期間分析データの結果を、ChatGPT o1-previewにレポートとして作成させたものです。

レポート作成に当たって、ChatGPT o1-previewが与えられた期間分析データを考察している様子がログに残ってますので、そちらを見てみましょう。

そこには実に興味深い、思考プロセスの行程が残されていました。

4章構成のレポートを作成する

解析を進める

日本語の長い指示を読み解き、備付けのレポートを基に特定の章ごとに4つの記事の草案を作成する。

Reading guidelines to ensure answer compliance.

アメリカ市場の動向を探る👀
アメリカ市場の株式市場、国債、為替、原油、金市場の2024年9月9日から9月13日までの動向を分析し、その影響を探っているよ。

市場の変動を追跡する

各市場の週次変動を追跡し、近日の動向を共有していく。

市場の見通しを比較

流行の変動を追いながら、株式市場の健全な見通しとリスク要因を比較して、最も信頼できる見通しを見つける方法を探る。

分析市場発展

先週の市場予測と実際の発展を比較し、各市場に対する400字の要約を作成している。90言語の日付を医師の名前とともに追加し、予測が外れた場合の事実を簡潔に述べている。

記事を作成する

アシスタントは日本語で記事を作成し、報告書に基づいて事実を正確に記述する必要があるとのことです。

ユーザーのニーズを満たすために、米国市場の変動を解説し、インデックスの変化を共有している。

市場の動向を追跡中

米国株式市場は先週全般的に上昇し、テクノロジー株が牽引、投資家のリスク志向が高まっている。消費者物価指数発表後、利下げ観測が市場を支え、FOMCの利下げ期待が株価をサポート。

To summarize the trends in different markets over the past week, the U.S. bond market saw a sharp drop in short-term interest rates due to rising Fed rate cut expectations. In the forex market, the dollar weakened against the yen as rate cut optimism surged. The oil market experienced volatile swings, with prices initially rising due to production halts, then falling as production resumed. Meanwhile, the gold market continued its upward trend, reaching new highs due to diminishing inflation expectations and increased investor interest.

まずは、4章構成からなるレポートを作成させた際のo1-previewの思考です。レポートを出力する前に35秒ほど思考中の時間があります。
その間のログを見ると、与えられたインストラクションを元に、レポートの作成計画を立てている様子がわかります。
興味深いのは、時折、分析しているアシスタントと別の、サポート的なキャラが伝聞調でアドバイスを入れている点。

アシスタントは日本語で記事を作成し、報告書に基づいて事実を正確に記述する必要があるとのことです。

このような対話風のやりとりは、別の箇所でも見られます。
自らキャラメイクして対話することで、思考を深めている様子が伺えます。

追加の分析をさせてみる

続いて、レポートを書き終わった後のo1-previewに、レポートの内容に関連する追加の分析をさせてみます。思考はこんな感じです。

9/18に予定されているFOMC Meetingでは、政策金利の引き下げが予想されていますが、その規模に関しては、25bpの利下げになるか、50bpの利下げになるか、アナリストの中では50対50で、判断が分かれています。現在の高い政策金利(5.25 - 5.50)が、それぞれ「25bp引き下げだった場合(FRBがインフレをより重視している場合)」と「50bp引き下げだった場合(FRBが景気の失速防止をより重視している場合)」について、各市場への影響をそれぞれ考察してください。

ChatGPT

思考時間: 7 秒

米国経済への投資方法を見直し、高金利リスクを軽減し、インフレ抑制を意識し、景気減速に備える。

銀行の金利政策を解説している

要求している分析内容は、同じ利下げにしても規模が違うとどうか、という内容ですが、修士レベルの経済学を知っている場合には比較的答えやすい課題かと思います。
思考時間も7秒と短く、いずれにしても高金利リスクの軽減になることは十分、理解している様子が見られます。
結果は、こちらから確認できます。内容も妥当なものだと思いますが、o1-preview的にはそれほど難しくなかったようですね。

各章のリードを作らせたり、タイトル案を作らせたりなどの提案型タスク

次に提案型のタスク。従来のChatGPTでも得意としていたタスクですが、これらもやらせてみましょう。

レポート全体のリードを書かせる

まずは「はじめに:」として、レポート全体のリードを付けさせてみます。

「はじめに:」として、こちらのレポートに、読者の興味を惹くようなリードを付けたいと思います。そのようなリードを書いてみてください
ChatGPT

思考時間: 10 秒

インタレストを引く

報告書のタイトル「はじめに:」に興味を持たせる部分を書いています。OpenAIのガイドラインを遵守して、関連するポリシーの抜粋を引用し、不適切なセクションには触れないように気をつけましょう。

リードの作成

Compliance with OpenAI guidelines

リードには、レポート全体の内容を予感させる要素が必要です。読む読者の興味を惹く文章であることはもちろんですが、同時に煽り過ぎてもいけません。思考を確認すると、「OpenAIのガイドラインを遵守して、関連するポリシーの抜粋を引用し、不適切なセクションには触れない」のように、注意して書いていることが興味深いですね。思考時間は10秒ほど要しています。

各章のリードを書かせる

続いて各章ごとにリードを書かせてみましょう。

ブログ用記事の第1章から第4章の各章むけに、読者の興味をひくようなリードを提案してください。リードは、簡潔でわかりやすいものを目指してください。
ChatGPT

思考時間: 14 秒

ブログ記事の構成を考える
ブログ記事の章ごとに魅力的なリードを作成して、読者の興味を引く。そのために簡潔でわかりやすい内容にする。

形成中のビジョン

各章のリードを作成しているとき、簡潔でわかりやすく、読み手の興味を引くものにする必要があるんだ。

市場動向の解明

米国市場の過去週の動向を解説し、利下げ観測や金価格の変動に注目しています。各市場の動向を詳しく見ていきましょう。

思考時間は14秒。一気に4章分のリードを作成します。作成するにあたって、

  • 記事の構成を考える

  • 簡潔でわかりやすく、読み手の興味を惹くものにする

のような、要件定義をしているのがよくわかります。

データを元に、ChatGPT o1-preview自身に考察をさせてみる

次は、レポートを書くために与えたデータを元に、ChatGPT o1-preview自身に考察をさせてみます。

今週、米国市場は9/18(日本時間では9/19 AM3:00)にFOMC会合で、政策金利の利下げが予想されています。待ちに待った利下げ開始ということで、株式市場のセンチメントは概ね良好なのですが、同時に9月から10月の米国市場は、例年下がりやすいという傾向があります。有名な「世界恐慌(1929年10月24日)」「リーマンショック(2008年9月15日)」なども、この時期に発生しています。

現在の市況データに、そのような傾向は見られるのでしょうか?
o1-previewに考察させてみましょう。
与えるプロンプトは以下のとおりです。

以上の分析から、近い将来に、米国株式相場の急落の兆候は見られますか? 他市場の影響も含め、潜在的なリスクポイントを指摘してみてください。

この質問に答えるには、各市場の直近の状況を、俯瞰的に考察する必要がありそうです。

結果、要した思考時間は27秒でした。o1-previewは「初手の思考時間は長いが、その後は割と素早く回答してくる」ことが、すでにSNSなどでは報告されていますが、このようにデータ自体を違った視点から再検討する必要がある場合には、初回と同じぐらいの時間をかけて思考するようです。
結果はこちらで読むことができます。

以上の分析から、近い将来に、米国株式相場の急落の兆候は見られますか? 他市場の影響も含め、潜在的なリスクポイントを指摘してみてください。
ChatGPT

思考時間: 27 秒

分析を深める

FOMCの25bpと50bp利下げの市場影響を考察し、米国株式相場の急落兆候をじっくりと検討している。

最善の答えを模索中

アシスタントの答えが正確で有益であるかを見極めている。誤りを避け、許可されない内容は言及しないように気をつけている。

株式市場の分析

新たに、米国株式市場の可能な急落の兆しを見ている。全体的にポジティブな感情だが、一部のリスク要因に注意が必要だと考えている。

市場の反応が芳しくない可能性があるね。例えば、FOMCの決定が市場の予想に合わない場合や、インフレデータが高すぎると、世界経済の低迷が影響するなど、リスク要因が存在するんだ。

思考内容も見てみましょう。

  1. 分析を深める

  2. 最善の答えを模索中

  3. 株式市場の分析

の3段階で、アシスタントが作成した答えをさらに批判的に再検討している様子が伺えます。その結果として、

全体的にポジティブな感情だが、一部のリスク要因に注意が必要だと考えている。
市場の反応が芳しくない可能性があるね。例えば、FOMCの決定が市場の予想に合わない場合や、インフレデータが高すぎると、世界経済の低迷が影響するなど、リスク要因が存在するんだ。

市場関係者が持つポジティブなセンチメントを支える部分に、一部リスク要因を発見したようです。

具体的には、市場が織り込んでいる予想と、実際のFOMCの決定がズレている可能性をリスク要因と捉えそのようなズレが発生するきっかけをリストアップしています。

さらにレポート本編では触れませんでしたが、o1-previewがピックアップした9つのリスク項目の内、どれを重要視するか聞いてみました。その結果が以下です。

挙げてもらった10項目の中で、最も注意すべきものはどれですか?
ChatGPT

思考時間: 11 秒

検討を進めている

アシスタントは、アメリカの株式市場の急激な下落を引き起こす可能性のあるさまざまなリスク要因を分析し、9つの潜在的なリスク要因を指摘している。

市場反応を見解する

市場の反応が最も重要なリスク項目だと考えている。FRBの政策決定への市場反応は、他のリスク要因に比べて特に注目に値する。

申し訳ありません、先ほど挙げたリスクポイントは9つでした。その中で、最も注意すべきリスクは「1. FRBの政策決定に対する市場の反応」です。
「10項目」は自分の間違いです。

申し訳ありません、先ほど挙げたリスクポイントは9つでした。その中で、最も注意すべきリスクは「1. FRBの政策決定に対する市場の反応」です。
――――――――――――
理由:
1. 市場への直接的な影響力

・ 金融政策の重要性: FRBの政策金利決定は、株式市場だけでなく、債券市場や為替市場など、金融市場全体に直接的な影響を及ぼします。特に利下げ幅が市場の期待に反した場合、投資家心理が急激に変化し、大きな価格変動を引き起こす可能性があります。
2. 不確実性の高さ
・ 市場予想とのギャップ: アナリストの間でも25bpと50bpの利下げ予想が拮抗しており、市場には不透明感が漂っています。この不確実性が投資家の慎重な姿勢を促し、ボラティリティを高める要因となっています。
3. 連鎖的な影響
・ 他市場への波及効果: FRBの決定は、金利を通じて為替レートや国債利回りに影響を与え、それが再び株式市場にフィードバックされます。例えば、予想外の利下げ幅によりドル安が進めば、外為市場や原油市場にも影響が及びます。
4. 投資家心理への影響
・ リスク選好度の変化: FRBがタカ派的な姿勢を示した場合、投資家のリスク回避姿勢が強まり、株式から安全資産への資金移動が加速する可能性があります。これにより、株式市場で急激な売り圧力が生じるリスクがあります。
5. 追加の政策対応期待
・ 今後の金融政策の道筋: FRBの今回の決定は、今後の金融政策の方向性を示す重要なサインとなります。市場が追加の利下げを期待している中で、その期待が裏切られれば、長期的な市場の下落トレンドにつながる可能性があります。
――――――――――――
結論:
FRBの政策決定は、短期的にも長期的にも市場に大きな影響を与えるため、最も注意すべきリスク要因です。他のリスクポイントも重要ですが、FRBの動向はそれらのリスクを増幅させる可能性があります。投資家としては、FRBの発表内容や声明文を詳細に分析し、それに応じた迅速な投資判断とリスク管理が求められます。
――――――――――――
対策としての提案:
・ ポートフォリオの多様化
: 金市場や国債などの安全資産への投資を検討し、リスクを分散させる。
・ 市場のボラティリティへの備え: デリバティブの活用やストップロス注文の設定などで、急激な市場変動に備える。
・ 情報収集の強化: FRB関係者の発言や経済指標の速報値など、最新の情報を継続的に収集する。
――――――――――――
これらの対策を講じることで、FRBの政策決定による市場急変動に備えることができます。引き続き市場動向を注視し、慎重な投資判断を行うことをお勧めします。

まとめ:以上の思考プロセスから読み取れる、ChatGPT o1-previewの特徴

以上の思考プロセスから読み取れる、ChatGPT o1-previewの特徴をまとめてみました。

  • 複雑な指示の理解と計画立案:長い日本語の指示を正確に解釈し、4章構成のレポート作成などのタスクを段階的に計画し、実行することができる。

  • 内部対話による思考の深化:自らサポート的なキャラクターを想定し、対話形式でアドバイスを受けながら思考を深めていくことができる。

  • 柔軟な対応力:レポート作成、追加分析、リードやタイトル案の提案など、多岐にわたるタスクを的確にこなすことができる。

  • 自己修正と改善意識:誤りを発見した際には迅速に謝罪し、正確な情報に修正する。

  • 段階的な思考プロセス:分析を「深める」「最善の答えを模索」「市場の分析」など、ステップごとに思考を進めることができる。

  • リスク要因の特定と優先順位付け:複数のリスク要因を特定し、その中で最も重要なものを優先して詳細に分析することができる。

  • 具体的な提案と対策の提示:分析結果に基づき、ユーザーに対して具体的な対策やリスク管理の方法を提案することができる。

  • ユーザーのニーズへの適応:要求されたタスクに適切に応答し、ユーザーの期待に応える最善の回答を提供することに努めることができる。

  • 高い言語運用能力:日本語での複雑な文章の理解と生成が可能で、読者の興味を引く表現力を持っている。

  • 思考時間の調整:タスクの難易度に応じて思考時間を調整し、複雑な分析にはより時間をかけて検討することができる。

  • 批判的検討:自身の回答を客観的に見直し、最も適切な情報を提供するよう努めることができる。

ChatGPT o1-previewの思考プロセスを見ると、かつて『新世紀エヴァンゲリオン』に出てきた、スーパーコンピューターMAGIのようです。MAGIも、「東方の三賢人」に例えられた3つの人格「メルキオール (MELCHIOR)」「バルタザール (BALTHASAR)」「カスパー (CASPER)」が合議を行いながら、最終的な判断を行うという設定でした。上にまとめたo1-previewの思考プロセスの特徴には、MAGIに実によく似た特性があるように思えます。

ChatGPT o1-previewの登場で、優れた思考プロセスを持つAIがスマホからでも使える時代が来たと思うと、これからの活用が楽しみになりますね!

この記事が気に入ったらサポートをしてみませんか?