見出し画像

「プログラミング」も資産運用もしたことないわたしがAIで株価を予測するー8ー 結果発表

こんにちは。『「プログラミング」も資産運用もしたことないわたしがAIで株価を予測する』の第8回です。 今回は結果報告というか、中間発表をしたいと思います。


1日後の株価予測

1日後の予測がちゃんと評価されているか、前回のようなプロットをしていきます。左上から順に、学習させる記事数を増やして言った場合のプロットです。途中まで、いい感じに増えてきて、400記事くらいまで来たとき、「これは1000記事まで増やせば8割方予測可能のなのでは!?」と期待に胸膨らませました。

画像1

しかし、ある時を境に予測は悪くなっていきました。その様子を横軸に記事数、縦軸にR2値をとってみれば

画像2

この理由はいろいろありすぎて正しい見当をつけるのが難しいと思いますが、単語数が増えすぎたことが原因かなと思いました。そこで、単語数をプロットしてみると、

画像3

確かに、単語数は増加していますが、白抜きの○のグラフに着目すれば、記事数が200位の時までの増え方の勢いが、記事数を増やしていくと弱くなっています。これは当たり前といえば当たり前で、使う単語が限られていて、かぶりが多くなるからでしょう。

実際、単語数/記事数(一記事あたりの単語数)をプロットすると、対数的に減少します。

画像4

単語数が増えすぎたことが問題なのか、1記事あたりの単語数が足りないことが問題なのか、ちょっとよく分かりませんが、単語が有限である以上、記事数に合わせて単語数を増やしていくことは難しいと思います。

7日間予測の方はどうかというと・・・

本来の目的は、スイング式の7日間の予測を行うことでした。そちらの方はどうでしょうか。

画像5

結果、「まだわからない」というところです。初期の頃に、ブレの範囲でたまたま0.4が出た以外は、0.2以下をさまよっていますが、さまよいながらも、だんだんと上昇している感じが見て取れます。期待感は持っていますが、記事数をどれくらいにまで増やせば良いのか、ちょっと分かりかねます(万単位になるかもしれない)。

考察

今回分かったことは、

①1日後の予測と7日後の予測では挙動が異なる。 

②読み込む記事数を単純に増やしただけでは1日後予測は悪くなってくる。 

③ 7日後予測はまだわからない

という感じです。今後、②の対策として、「単語の量ではなく、質を厳選する」というのをチャレンジしてみようと思っています。また、7日後予測の方も、いずれは②のような境界が出現する可能性もあります。(それは単語数ではなく、別な要因であると思いますが……)

今後に期待したいと思います。


つづく



この記事が気に入ったらサポートをしてみませんか?