ChatGPTの解説です。
公開日:2023年4月22日
※動画を再生してから、インタビューを読むのがオススメです。
ChatGPTのような大規模な言語モデルの用途は爆発的に広がっており、毎日新しいユースケースを目にするような気がします。
しかし、投資家として重要なのは、これらのモデルを利用してリターンを向上させることができるかどうかということです。
このビデオでは、この点に関して非常に興味深い結果が発表された最近の研究を見て、これを自分のポートフォリオに実際に適用できるかどうかも考えてみます。
もし私たちのコンテンツを楽しんでいただけたら、忘れずにチャンネル登録をお願いします。
そうすれば、新しいコンテンツを見逃すことはありませんし、このビデオの「いいね!」をクリックすることもできます。
それでは、ChatGPTが株式リターンの予測に使えるかどうか、もう少し詳しく見ていきましょう。
これからお話しするのはセンチメント分析で、基本的な考え方は、ニュースのヘッドラインを取り上げることです。
ニュースの見出しはどのようなニュースサービスからでも構いませんが、その見出しをある種のモデルに送り込みます。
このモデルは、ニュースの見出しをポジティブなニュースかネガティブなニュースかによって、買いシグナルまたは売りシグナルに変換します。
そして、モデルがセンチメントを書き、それが市場の反応を適切に捉えることができれば、それが重要なポイントになります。
そうすれば、その推奨に基づいて実際にお金を稼ぐことができるのです。
このようなモデルはどのようなものでしょうか?
いくつかのモデルは以前から存在しています。
この横にあるのはRaven Packの例ですが、これは膨大な量の非構造化データ(ニュースフロー、ソーシャルメディア、テキストデータ、決算報告書のトランスクリプトなど)を取り込み、それらをセンチメント分析に変換して、株の売買のシグナルを与えるというものです。
Ravenのパック分析は、金融データのみに対応するように非常によくできています。
一方、大規模言語モデルは、教師なしで学習する一般的なモデルです。
データセットを見せるだけで、与えられたプロンプトに基づいて正しい出力を生成するように学習することができます。
最近、これらのモデルは爆発的に複雑化しており、その複雑さを表す一つの指標として、モデルのパラメータ数が挙げられます。
2018年、最先端のモデルはGoogle AIによるもので、「BERT LARGE」でした。
あれはモデルのパラメータが3億4千万もあり、そのモデルを持つ競合はOpenAIからやってくることになります。
GPTの最初のバージョン、つまりGenerative P-Train Transformerモデルは、1億1000万個のパラメーターを持っていました。
GPT-2は15億のパラメータを持っていました。
つまり、モデルに複雑性を持たせることで、分析がより洗練され、自然言語における単語間の長期的な関係をより多く拾い上げることができるようになるのです。
また、バートとは、トランスフォーマーによる双方向エンコーダ表現の略で、このような頭文字をとっています。
このような大規模な言語モデルに入力するプロンプトは、非常に重要です。
例えば、ここではOpenAIのChatGPTを使っていますが、アクティブ投資とパッシブ投資に関する短いリメリックを書くように指示しました。
これで、かなりうまくいったことがお分かりいただけると思います。
韻を踏んでいるので、A-A-B-B-Aとなっています。しかし、この文章を自分で読んでみると、音節の数が適切でないことがわかります。
特に4行目では、11音節になってしまっていて、とても不自然に聞こえます。
そこで、各行の音節数を指示して修正してみましたが、それでもまだよくわからないことがわかります。
つまり、これは一般的な言語モデルであり、叙情詩のような特定のものに対してチューニングされているわけではありません。
また、すべてのタスクで非常に優れた性能を発揮するわけではありません。
しかし、非常に広範なタスクでうまく機能します。
しかし、誤解を恐れずに言えば、これはすごいことなのです。
そこで、動物園の時系列を価格からリターンに変換するRスクリプトを書くように指示したところ、そのスクリプトは実際に動作したのです。
それだけでなく、そのスクリプトがどのように機能するかについての説明も書いてくれました。
このように、モデルは非常に洗練されたものになっていますが、それでも時々うまくいかないことがあります。
しかし、重要なのは、正しい出力を生み出すプロンプトを作成できるかどうかです。実際、このような大規模な言語モデルのプロンプトを作成するプロンプトエンジニアという新しい職種が存在するのです。
では、このような大規模言語モデルを用いて、株式のセンチメント分析を行うにはどうしたらよいのでしょうか。
これからお見せする結果は、2023年4月に発表されたこの論文によるものです。この論文では、様々なモデルの予測精度を比較しています。その中には、先ほど見たRavenPackニュース分析ツール、GPT1、GPT2、GPT3.5バージョンを使用するChatGPT、さらにBERTモデルの2種類のバージョンと、ますます複雑になっていくGPTがあります。
現在では、銘柄に関するニュース記事全体をモデルに供給するのではなく、ニュースのヘッドラインにのみ焦点を当てるというアプローチがとられています。
この見出しは、これから説明するように、非常に標準化されたプロンプトを使ってモデルに提示され、この見出しが株価のセンチメントにとってポジティブかネガティブかを判断する必要があるのです。
新聞に掲載されている見出しの例を見てみましょう。データベースプロバイダーのオラクルと、あまり知られていないリミニストリートという会社についての記事です。
リミニストリートは、オラクルやSAPのソフトウェア製品に関するサポート製品やサービスを提供しています。この例では、このヘッドラインとそれに付随するストーリー全体を見てみましょう。
リミニが他のクライアントに漏らしたとされる知的財産が、オラクルに帰属していたことが問題視されたのです。
そして、オラクルは裁判でリミニストリートに対して63万ドルの罰金を科すことに成功しました。
ですから、個人的には、これはオラクルにとってプラスになるのではないかと思っています。
そこで、研究論文がこれらのヘッドラインをモデルに送り込むために用いた標準化プロンプトは、次のようなものです。
まず、モデルに「これまでの指示をすべて忘れろ」と指示します。
おそらく、これまでのプロンプトを白紙に戻すのだろう。
そして、「あなたは金融の専門家です」と言います。
それだけでなく、あなたは株の推奨経験を持つ金融の専門家です。
そして、ChatGPTに見出しにどう答えるかを指示します。
最初の行で、その見出しが株にとって良いニュースなのか、悪いニュースなのか、不確かなものなのかによって、「はい」「いいえ」「不明」のいずれかを答えます。
そして、その1語1行の回答の後に、その回答を詳しく説明するようモデルに求めます。その際、次の行に短く簡潔な文章で、その判断を説明する必要があります。
そして、どの銘柄についての話なのかをモデルに伝えます。
つまり、この場合、ヘッドラインはオラクルの株価にとって良いのか悪いのか、そして、それが短期、中期、長期のどれに当たるのかも指定します。
この場合、短期的なものです。
そして最後に、実際のヘッドラインがモデルに与えられます。
つまり、赤字の部分は、銘柄や用語、見出しの違いによって置き換えられる部分です。
しかし、白で書かれた残りのテキストは、どの銘柄でもどの見出しでも同じです。
では、そのプロンプトに対するChatGPTの回答です: 答えは「イエス」です。
つまり、この見出しはその銘柄にとって良い見出しであり、その説明は実は非常に洗練されています。
つまり、Rimini Streetに対する罰金は、Oracleが知的財産を保護できることを示すため、投資家の信頼を高め、間接的にOracleの製品とサービスに対する需要を高める可能性があるということです。
そして実際、これは非常に良い回答だと思います。
Ravenpackの回答を見てみると、オラクルに対するネガティブな感情はマイナス0.52となりました。
つまり、言語モデルが見出しの単語間の関係という興味深いものを推論する能力によって、これが法廷での和解であるという直接的な問題を見抜き、それが株価にとってプラスに解釈される可能性があることを見抜くことができるのです。
このビデオをご覧になり、投資についてもっと学びたいと思われたなら、私たちのコミュニティに参加して、同じ志を持つ投資家たちとオンラインで学ぶことができるメンバーシップを提供していることを思い出してください。
とてもフレンドリーです。
会員限定のコンテンツや会員限定のビデオもたくさんありますし、チャットアプリケーションを使ってお互いにチャットしたり、いつでも好きなときに質問したりすることができます。
もっと詳しく知りたい方は、私の下にある説明のリンクをクリックするか、pensioncraft.comにアクセスしてみてください。
さて、モデルの性能はどうだったのでしょうか?
さて、パフォーマンスを測定するときはいつも、サンプルの範囲外で行うことに十分注意しなければなりません。
そうでなければ、株価がどうなったかをモデルが実際に知ってしまう可能性があるからです。
さて、幸運なことに、研究者が使用したChatGPTのバージョンには、2021年9月以降のトレーニングがありませんでした。
そのため、2021年10月から2022年12月までのヘッドラインのみを使用することで、モデルが答えを知ることができないようにすることができました。
また、使用する銘柄については、その銘柄に関するニュース記事が掲載され、その見出しがRaven Pack Dow Jonesのニュース記事フィードから取得されている必要があり、米国の取引所の銘柄を使用しました。
つまり、ニューヨーク証券取引所、ナスダック、アメリカン証券取引所です。
ここで、完全に完璧なモデルがあったと仮定しましょう。
どのようなモデルになるのでしょうか?
私の横には、2つのバケツに分けられたリターンの分布が見えます。
例えば、モデルによって判断されたある銘柄のポジティブな見出しを受け取ったとします。これはグッドニュースのカテゴリーに入ります。
もしモデルが完璧であれば、翌日のリターンは、良いニュースが正しければ必ずプラスになり、逆に悪いニュースだと思えば、100%の精度でマイナスのリターンを予測することになります。
もちろん、現実の世界では、決してそんなことはありません。
なぜなら、良いニュースの平均リターンは、悪いニュースの平均リターンよりも高いからです。
これが、私たちが本当に望むことのできる最高の状態です。
偽陽性と偽陰性は常に存在しますし、結果はこのようなものでした。
ここに各モデルを列挙しています。
GPT、ChatGPT、最も洗練されたGPTモデルです。
GPTの基本バージョンであるGPT-1、GPT-2があります。
BERTモデルもありますし、Ravenもあります。
このスコア・テーブルでは、モデルが「良いニュース」「不明なニュース」「悪いニュース」のいずれを伝えたかを調べ、翌日の平均リターンを調べますが、これはプロンプトに表示された銘柄のものです。
GPTの場合、良いニュースがあったときの平均リターンはプラス0.13%であることに注目してください。
悪いニュースがあったときは、マイナス0.13%でした。
つまり、良いリターンと悪いリターンを分離し、センチメントを解釈する役割を果たしたのです。
しかし、他のモデルを見ると、非常に悪い仕事しかしていません。
GPT-1とGPT-2の平均リターンは、モデルによると良いニュースか悪いニュースかによって、かなり似ていました。
つまり、より多くのパラメータと推論能力を持つより洗練されたGPTモデルは、ヘッドラインからポジティブな感情とネガティブな感情を識別するために、実際にはかなり良い仕事をすることができるということを示しているのです。
実際にこれを取引戦略に導入するとしたら、著者らはこの線をどのように生成したのかあまり明確にしていませんが、何をするかというと、ヘッドラインがあった銘柄をすべて取り上げるのです。
ヘッドラインがポジティブだとモデルが判断した場合、その銘柄を買い、翌日まで保有し、その後売却します。
一方、ネガティブなニュースだと判断した場合は、下落によって利益を得る銘柄を空売りし、翌日には空売りを解消します。
つまり、毎日再生されるロングショートのポートフォリオがあり、それをこの期間繰り返すだけで、ロングショート戦略が非常にうまくいっていることがわかるのです。
モデルによると、株価に対してネガティブなセンチメントがある銘柄をショートするだけの戦略をお持ちでしたら、そのパフォーマンスはかなり良いですが、ご注意いただきたいのは、そのパフォーマンスが安定していないということです。期間の初めには、優れたパフォーマンスがありましたが、その後、結果はあまり変わらず、平坦でした。そして、期間の終わりに再び優れたパフォーマンスが現れました。
また、ロングオンリー戦略もあり、これは良いニュースがあった銘柄を買うというもので、全てのニュースが何なのかは不明ですが、論文では説明されていませんでしたが、これは2022年に株価が下落していた時期です。
しかし、これは2022年に株価が下落していた時期のことで、プラスのリターンが得られたという事実は、実に興味深いものです。
しかし、これは取引コストを除いた場合であり、後で見るように、これは非常に重要なことです。
つまり、ChatGPTが株式市場のリターンを予測するのに優れているのは、高度な言語理解能力によって、ニュースの見出しに含まれるニュアンスや微妙なニュアンスを捉えることができるからだと著者たちは結論付けています。
しかし、より興味深いのは、ChatGPTが市場参加者と同じように物事を解釈しているという点です。
株式市場の動きを予測するためには、次のようなことが必要です。
しかし、ここでもっと興味深いのは、実際に市場参加者と同じように物事を解釈している点だと思います。
株式市場の動きを予測するためには、投資家の心理に入り込む必要があります。このモデルがそれを可能にしたことは、本当に驚くべきことだと思います。
一般的な言語学習モデルですが、その結果、より信頼性の高いセンチメントスコアを生成できるようになり、日々の株式市場のリターンをより良く予測できるようになったというのが、彼らの結論です。
だから、"これで儲けられるのか?"と思っていることでしょう。
しかし、個人的には、今回実装されたモデルでは現実的ではないと思います。
このモデルは、今日のヘッドラインを見て、買うか売るかを決め、翌日には売るか空売りを解消する、ということをやっていました。
ですから、このポートフォリオでは、株式の入れ替わりが激しくなる可能性があるのです。
もちろん、これを適用する銘柄を制限することもできますし、さまざまな回避策がありますが、この回転、つまりビッドオフが広がっていることが、この戦略の利益の大部分を食ってしまうことになるのです。
そして思い出してみてください、アウトパフォームは期初と期末の2回、かなり集中したバーストで発生しました。
つまり、もしこれがアウトパフォームしなかったとしても、スプレッドのビッドオフで継続的にチャーンして損をすることになるのです。
また、最もうまくいった戦略はロング・ショート戦略で、これはマーケット・ニュートラルなヘッジファンド戦略のようなものです。
ヘッジファンドがこれを実行するのは、単一銘柄のショートをかなり簡単に行えるので、実用的だと思います。
しかし、個人投資家の場合、それを実行するのは容易ではありません。
そのため、ロングオンリーの戦略を取ることになるのですが、これはあまり良いパフォーマンスではなかったことを覚えています。
もう一つの問題は、このモデルについて、そしてそのパフォーマンスの高さについて、今や誰もが知っているという事実です。
アルファとは、市場に対する特別な洞察力によって市場を打ち負かすことができる場合のアウトパフォームのことです。
そしてこの洞察は、誰でもOpenAIから非常に安く買うことができます。
つまり、これは今やほとんどすべての投資家の手中にあるのです。
そして、ある戦略についてニュースが広まると、通常、その戦略のパフォーマンスが低下し始めるのです。
それは、取引が混雑し始め、皆が同じことをし、ある人は他の人よりも早くそれを行うので、おそらくランチを食べることになるからです。
このようにアウトパフォームが徐々に低下していくことをアルファ・ディケイと呼びますが、これはヘッジファンドがいつも使っていることです。
もし素晴らしい戦略を思いついたとしても、時間とともにその戦略のアウトパフォームが徐々に低下していくことが多いので、新しい戦略を考えなければならないのです。
ですので、個人的には、この戦略が私たちのような個人投資家にとってうまくいくとは確信が持てません。もし誰かがこれを利益につなげるとしたら、おそらく多くのリソースをこの問題に投入できるヘッジファンドでしょう。彼らは、おそらくすでにこのようなことを行っているでしょう。
この論文では、モデルが投資家の心の中に入り込み、人間がするのと同じように、ヘッドラインに対してどのような感情を抱くかを予測することができることを示しており、本当に魅力的だと思います。
これは、本当に驚くべきことです。
この戦略の実用化という点では、個人投資家にとってはあまり実用的ではないと思います。
バリエーションがあれば使えるかもしれませんし、マクロ経済情報を使って長期的な予測をモデルに与えることもできますが、この論文で紹介されているような実用性はないと思います。
もし、あなたがメンバーシップに参加して、マクロ経済変数だけでなく市場変数も追跡できるトラッカーや、メンバー限定のビデオ、コミュニティの他のメンバーとのチャットなど、すべての特典にアクセスしたい場合は、以下のリンクの説明を見るか、pensioncraft.comにアクセスしてください。
また、いつもご清聴ありがとうございます。