株式掲示板を用いた金融指標の予測
金融指標の一つとして,VI 指数(ボラティリティ・インデックス)がある.これは,金融商品における価格変動の可能性を示している.仮に,VI 指数の上昇を予測することができれば,投資家の投資リスクを低減することができる可能性がある.しかし,株価の値動きは,効率的市場仮説 により,ランダムウォークするため, VI 指数の予測は非常に困難な課題である.金融市場に影響を与える事象は,社会の出来事や,それによって生じる投資家の心理状態など,様々な要因があるため,多くの研究者は,過去の金融の時系列データ以外にも着目して,金融指標の予測を行っている.例えば,マスメディアのテキスト情報を用いて金融指標を予測した研究 ,ソーシャルメディアのキスト情報を用いて金融指標を予測した研究 などある.本研究では,マスメディアとソーシャルメディアの両方のメディアに着目する.新聞などのマスメディアの情報は,経済や金融に影響を与える出来事や社会情勢を把握するうえで有用であり,またソーシャルメディアのデータも社会の出来事だけでは捉えきれない投資家の関心や意見・感情を測るうえで有用なデータといえる.先行研究の多くはどちらか一方のメディアに焦点を当てて金融指標の予測を行っているが,これらの両メディアのデータを解析し統合して金融指標の予測に用いることで,社会情勢と投資家心理の両方を考慮した効果的な予測が可能になると考える.本研究では,マスメディアとソーシャルメディアの両方のメディアに着目し,マスメディアのデータとして新聞の記事内容,ソーシャルメディアのデータとしてインターネット株式掲示板(以下,株式掲示板)を
機械学習を用いた金融商品の予測
金融指標を予測することは,投資家にとって,収益や投資リスクの回避につながるため,非常に重要である.そのため,これまでに多くの先行研究が行われてきた.例えば, Chen ら [2] は,LSTM を用いて,中国の株式市場におけるリターンをモデル化し,中国の株式市場の予測を行った.結果として,ランダムな予測手法と比較して,提案された手法は,株式リターンの予測精度を 14.3%から 27.2%に向上させた.さらに,Long ら は,金融時系列データの特徴抽出と相場の変動予測に適した,マルチフィルタニューラルネットワーク(MFNN)を提案した.実験の結果として,従来の予測モデルよりも精度,収益性,安定性の面で優れていることを示した.しかし,過去の金融時系列データを用いて,金融商品を予測を行う研究は数多く行われてきているが,効率的市場仮説 [1] により,チャンスレート程度の予測精度になることがわかっている.そこで,過去の金融情報の時系列データだけではなく,マスメディアやソーシャルメディアなどのテキスト情報を用いて,金融商
品を予測を行う研究が行われている.
詳しい銘柄情報は前回記事「2024年東証スタンダードトップテンバガー銘柄候補一覧」をご覧ください。 2023年のTOPIX基準株価動向(後編)と2024年の注目テーマ銘柄を紹介
マスメディアを用いた金融指標の予測
金融指標の予測において,マスメディアのテキスト情報を用いた研究は,これまでに数多く行われてきた.例えば, Peng ら [4] は,一般的な単語埋め込み手法とDeep Neural Network を適用し,金融ニュースを活用した株価の動きを予測するモデルを構築した.実験の結果として,金融ニュースを株価予測モデルに適用することで,過去の金融価格情報のみを用いたベースラインシステムよりも,株価予測精度を大幅に向上させたことを示した. Li ら [5] は,株式市場の終了間際に発行される夜間ニュースを用いて,夜間の株価の動きを予測することを目的とした夜間株価予測法を提案した.さらに,銘柄間の関係を利用するため, LSTM モデルを拡張した LSTM-RGCN を提案した.実験の結果として,提案したモデルは,ベースラインのモデルと比較して,優れていることを示し,さらに,市場全体だけでなく,金融ニュースで取り扱っていない銘柄の値の動きも推測できることを示した.のように,マスメディアのテキスト情報を金融指標の予測に用いることで,金融情報のみで予測したモ
ソーシャルメディアを用いた金融指標の予測
金融指標の予測において,ソーシャルメディアのテキスト情報を用いた研究も,これまでに数多く行われてきた.例えば,Wu ら [8] は,中国におけるソーシャルメディアのデータを用いて,株価変動に対するソーシャルメディアの影響を調査した.その結果,株価の変動に対する注目度の上昇といった社会的要因の影響が,世論の影響よりも大きいことを発見した.さらに,社会的要因と世論心理に基づいた株価変動率を予測し,ソーシャルメディアの情報は,翌日のボラティリティに与える影響が大きく,時間経過とともに減少していることを発見した.Suwa ら [9] は,株式売買に特化したソーシャルメディアを用いて,日経 VI 指数の上昇を予測する手法を提案した.具体的には,ソーシャルメディアの投稿文書に対して,トピックモデルの LDA を用い
て各文書における 100 種のトピックに所属する確率を獲得し,それらを日別にまとめ,機械学習モデルの入力とした. そして,日経 VI の上昇とその他の 2 値分類問題を設定し,実験の結果として,Precision, Recallともに 0.45 の予測性能を得た.このように,ソーシャルメディアのテキスト情報は,投資家の意見や気持ちの情報も反映されており,金融指標の予測に有効である可能性を示している.