見出し画像

意外!! 二値分類の予測精度が向上 AIを使って日経平均株価の予測に挑戦 アメリカがくしゃみをすると日本が風邪をひく編


説明変数にダウ、S&P500, ナスダックの指標を追加

Pythonプログラムをバージョンアップし、説明変数にダウ、S&P500, ナスダックの指標を追加しました。

詳細は、下記の記事を参照ください。

そこで、早速、日経平均株価の二値分類を行うAIモデルの学習および評価への影響を確認することにしました。

ダウ、S&P500, ナスダックの指標がAIモデルの学習および評価に与える影響を確認

ダウ、S&P500, ナスダックの指標が日経平均株価の二値分類を行うAIモデルの学習および評価に与える影響を確認するための条件は以下の通りです。

  • ダウ、S&P500, ナスダックの指標が与える影響を確認する条件

    • AIモデルは4層Affine構造とする

    • Neural Network Consoleが用意している学習データのシャッフル機能は無効とする

    • 各データは各カテゴリ(日経平均株価、ダウ、S&P500, ナスダック)毎に標準化を行う

4層Affine構造のAIモデルを選択した理由と学習データのシャッフル機能を無効とした理由は、これまでの検証において高い予測精度を得ることができたからです。

先ずは、評価の基準として、説明変数に日経平均株価の始値、高値、安値、終値のみを使用した場合における学習曲線と混同行列を以下に示します。

説明変数 日経平均株価 学習曲線
説明変数に日経平均株価のみを使用した場合の学習曲線
説明変数 日経平均株価 混同行列
説明変数に日経平均株価のみを使用した場合の混同行列

学習曲線は、Training Error, Validatio Error共に減少することなく、学習が進んでいないことが予想されます。

また、混同行列から、学習済みAIモデルの予測がy'=1(翌営業日の日経平均株価が上がると予測)に偏っており、正しく学習できていないことが確認できます。

続いて、日経平均株価とダウの始値、高値、安値、終値を説明変数とした場合における学習曲線と混同行列を以下に示します。

説明変数 日経平均株価 ダウ 学習曲線
説明変数に日経平均株価、ダウを使用した場合の学習曲線
説明変数 日経平均株価 ダウ 混同行列
説明変数に日経平均株価、ダウを使用した場合の混同行列

説明変数にダウを加えたことで、学習曲線においてTraining Errorが低下していることが確認できます。

一方で、Validatio Errorは上昇傾向となりました。

また、混同行列では、AIモデルが翌営業日の日経平均株価が上がる、あるいは、下がると予測できるようになり、Accuracyは62.00%と向上しました。

さらに、日経平均株価、ダウ、S&P500, ナスダックの始値、高値、安値、終値を説明変数とした場合における学習曲線と混同行列を以下に示します。

説明変数 日経平均株価 ダウ S&P500 ナスダック 学習曲線
説明変数に日経平均株価、ダウ、S&P500, ナスダックを使用した場合の学習曲線
説明変数 日経平均株価 ダウ S&P500 ナスダック 混同行列
説明変数に日経平均株価、ダウ、S&P500, ナスダックを使用した場合の混同行列

説明変数にダウ、S&P500, ナスダックを加えたことで、さらにAccuracyが65.60%まで向上しました。

意外なことに、日経平均株価の二値分類において、予測精度の記録更新となりました。

これまで、目的変数として、日経平均株価に基づくテクニカル分析の指標をアレコレと追加してきました。

しかし、アメリカ市場の株価データを追加する方が予測精度の向上に繋がる結果となりました。

まさに、アメリカがくしゃみをすると日本が風邪をひく状態です。

いろいろと気になることが出てきました

こうなると、いろいろと気になることが出てきました。

例えば、イギリスの株価指数であるFTSE100や、日本のTOPIX, 中国の株価指数による影響はあるのか、ないのか。

あるいは、もっと別の視点で、各国の為替や長短金利、物価指数、GDPといった経済指標、等はどうなのか。

しかし、日々の株価データに対して更新頻度が低い情報をどのように組み合わせるのが良いかが分かりません。

また、各データの標準化も何らかの工夫が必要です。

とりあえず、簡単に確認できそうなものは検証してみようと思います。

この記事が気に入ったらサポートをしてみませんか?