日々の壁打ち:ChatGPT o1-previewの思考プロセスに、MAGI Systemをみる想いがした
はじめに:ChatGPT o1-previewを使ってみた
上のnote記事は、Bloombergが毎朝伝える米国市場市況記事を、毎日GPTsが分析した結果を1週間分収集し、さらに週間分析のためのステップインストラクションに基づいてGPTsが作成した期間分析データの結果を、ChatGPT o1-previewにレポートとして作成させたものです。
レポート作成に当たって、ChatGPT o1-previewが与えられた期間分析データを考察している様子がログに残ってますので、そちらを見てみましょう。
そこには実に興味深い、思考プロセスの行程が残されていました。
4章構成のレポートを作成する
まずは、4章構成からなるレポートを作成させた際のo1-previewの思考です。レポートを出力する前に35秒ほど思考中の時間があります。
その間のログを見ると、与えられたインストラクションを元に、レポートの作成計画を立てている様子がわかります。
興味深いのは、時折、分析しているアシスタントと別の、サポート的なキャラが伝聞調でアドバイスを入れている点。
このような対話風のやりとりは、別の箇所でも見られます。
自らキャラメイクして対話することで、思考を深めている様子が伺えます。
追加の分析をさせてみる
続いて、レポートを書き終わった後のo1-previewに、レポートの内容に関連する追加の分析をさせてみます。思考はこんな感じです。
要求している分析内容は、同じ利下げにしても規模が違うとどうか、という内容ですが、修士レベルの経済学を知っている場合には比較的答えやすい課題かと思います。
思考時間も7秒と短く、いずれにしても高金利リスクの軽減になることは十分、理解している様子が見られます。
結果は、こちらから確認できます。内容も妥当なものだと思いますが、o1-preview的にはそれほど難しくなかったようですね。
各章のリードを作らせたり、タイトル案を作らせたりなどの提案型タスク
次に提案型のタスク。従来のChatGPTでも得意としていたタスクですが、これらもやらせてみましょう。
レポート全体のリードを書かせる
まずは「はじめに:」として、レポート全体のリードを付けさせてみます。
リードには、レポート全体の内容を予感させる要素が必要です。読む読者の興味を惹く文章であることはもちろんですが、同時に煽り過ぎてもいけません。思考を確認すると、「OpenAIのガイドラインを遵守して、関連するポリシーの抜粋を引用し、不適切なセクションには触れない」のように、注意して書いていることが興味深いですね。思考時間は10秒ほど要しています。
各章のリードを書かせる
続いて各章ごとにリードを書かせてみましょう。
思考時間は14秒。一気に4章分のリードを作成します。作成するにあたって、
記事の構成を考える
簡潔でわかりやすく、読み手の興味を惹くものにする
のような、要件定義をしているのがよくわかります。
データを元に、ChatGPT o1-preview自身に考察をさせてみる
次は、レポートを書くために与えたデータを元に、ChatGPT o1-preview自身に考察をさせてみます。
今週、米国市場は9/18(日本時間では9/19 AM3:00)にFOMC会合で、政策金利の利下げが予想されています。待ちに待った利下げ開始ということで、株式市場のセンチメントは概ね良好なのですが、同時に9月から10月の米国市場は、例年下がりやすいという傾向があります。有名な「世界恐慌(1929年10月24日)」「リーマンショック(2008年9月15日)」なども、この時期に発生しています。
現在の市況データに、そのような傾向は見られるのでしょうか?
o1-previewに考察させてみましょう。
与えるプロンプトは以下のとおりです。
この質問に答えるには、各市場の直近の状況を、俯瞰的に考察する必要がありそうです。
結果、要した思考時間は27秒でした。o1-previewは「初手の思考時間は長いが、その後は割と素早く回答してくる」ことが、すでにSNSなどでは報告されていますが、このようにデータ自体を違った視点から再検討する必要がある場合には、初回と同じぐらいの時間をかけて思考するようです。
結果はこちらで読むことができます。
思考内容も見てみましょう。
分析を深める
最善の答えを模索中
株式市場の分析
の3段階で、アシスタントが作成した答えをさらに批判的に再検討している様子が伺えます。その結果として、
市場関係者が持つポジティブなセンチメントを支える部分に、一部リスク要因を発見したようです。
具体的には、市場が織り込んでいる予想と、実際のFOMCの決定がズレている可能性をリスク要因と捉え、そのようなズレが発生するきっかけをリストアップしています。
さらにレポート本編では触れませんでしたが、o1-previewがピックアップした9つのリスク項目の内、どれを重要視するか聞いてみました。その結果が以下です。
まとめ:以上の思考プロセスから読み取れる、ChatGPT o1-previewの特徴
以上の思考プロセスから読み取れる、ChatGPT o1-previewの特徴をまとめてみました。
複雑な指示の理解と計画立案:長い日本語の指示を正確に解釈し、4章構成のレポート作成などのタスクを段階的に計画し、実行することができる。
内部対話による思考の深化:自らサポート的なキャラクターを想定し、対話形式でアドバイスを受けながら思考を深めていくことができる。
柔軟な対応力:レポート作成、追加分析、リードやタイトル案の提案など、多岐にわたるタスクを的確にこなすことができる。
自己修正と改善意識:誤りを発見した際には迅速に謝罪し、正確な情報に修正する。
段階的な思考プロセス:分析を「深める」「最善の答えを模索」「市場の分析」など、ステップごとに思考を進めることができる。
リスク要因の特定と優先順位付け:複数のリスク要因を特定し、その中で最も重要なものを優先して詳細に分析することができる。
具体的な提案と対策の提示:分析結果に基づき、ユーザーに対して具体的な対策やリスク管理の方法を提案することができる。
ユーザーのニーズへの適応:要求されたタスクに適切に応答し、ユーザーの期待に応える最善の回答を提供することに努めることができる。
高い言語運用能力:日本語での複雑な文章の理解と生成が可能で、読者の興味を引く表現力を持っている。
思考時間の調整:タスクの難易度に応じて思考時間を調整し、複雑な分析にはより時間をかけて検討することができる。
批判的検討:自身の回答を客観的に見直し、最も適切な情報を提供するよう努めることができる。
ChatGPT o1-previewの思考プロセスを見ると、かつて『新世紀エヴァンゲリオン』に出てきた、スーパーコンピューターMAGIのようです。MAGIも、「東方の三賢人」に例えられた3つの人格「メルキオール (MELCHIOR)」「バルタザール (BALTHASAR)」「カスパー (CASPER)」が合議を行いながら、最終的な判断を行うという設定でした。上にまとめたo1-previewの思考プロセスの特徴には、MAGIに実によく似た特性があるように思えます。
ChatGPT o1-previewの登場で、優れた思考プロセスを持つAIがスマホからでも使える時代が来たと思うと、これからの活用が楽しみになりますね!
この記事が気に入ったらサポートをしてみませんか?