見出し画像

[競馬予想AI] 走破タイムから馬の強さは測れるか?【予想編】

走破タイムから各馬の強さを測ることはできるかというシリーズです。
今回は、前回推定した基準タイムを利用して着順の予想ができるか実験をしてみます。

▼前回、基準タイムを推定した記事はこちら


基準タイムと走破タイムだけで予想する

早速、前回つくった基準タイムを使って今レースの走破タイムを計算して着順を予想してみます。

予想方法

前走の基準タイムと走破タイムとの差を使って、今レースの着順予想をしてみます。単純に、前走の基準タイムと走破タイムとの差をとり、この値を降順にソートします。

的中率と回収率

単勝と複勝の的中率および回収率は以下の通りになりました。

的中率

単勝:15.3%
1着予想馬の複勝:37.0%
2着予想馬の複勝:31.8%
3着予想馬の複勝:27.2%

回収率

単勝:83.2%
1着予想馬の複勝:80.7%
2着予想馬の複勝:75.2%
3着予想馬の複勝:75.0%

的中率のわりには回収率は高めかなという印象ではありますが、イマイチですね。実践で行うには難しそうです。

では続いて、この値を現行のAIの特徴量に追加してみるとどうなるでしょうか?


AIに特徴量として組み込んで予想する

前走の基準タイムと走破タイムとの差を特徴量として現行のAIに組み込んで予想してみます。以下に、特徴量組み込み前とどれくらい指標が変わったかを示します。

的中率と回収率

的中率

単勝:+0.61ポイント
1着予想馬の複勝:+1.12ポイント
2着予想馬の複勝:+0.36ポイント
3着予想馬の複勝:-0.91ポイント

回収率

単勝:±0.0ポイント
1着予想馬の複勝:+1.56ポイント
2着予想馬の複勝:+0.50ポイント
3着予想馬の複勝:-1.58ポイント

的中率と回収率ともに上昇したとはいえなさそうです。基準タイムのような特徴量は今まで使っていなかったので、ある程度的中率や回収率が上昇することを期待していたのですが少し残念です。
では、何が原因で性能が上がらなかったのでしょうか。


AIの性能が上がらない原因の考察

基準タイムと走破タイムとの差の分布が広い

3着の馬の走破タイムから基準タイムを割り出していますが、その基準タイムと3着の馬の走破タイムの分布を見ると分布が広いことが分かります。

3着馬の基準タイムと走破タイムの差の箱ひげ図

25%~75%点の間隔は±1秒弱となっています。競馬において着差2秒はかなり大きいです。2秒は約10馬身差となりますのでこの情報をもって予想を行うのはかなり難しいことがわかります。

基準タイムの作り方の問題

3着馬の走破タイムで基準タイムを作っていました。これは3着内であれば馬券に影響するので、3着内に入る可能性がある馬をあぶりだすことを想定して設定したものです。しかしこれでは良い結果は得られませんでした。1着馬の走破タイムで基準タイムを作成するとどうでしょうか。

予想方法の問題

前走の基準タイムと走破タイムとの差をとり、この値を降順にソートすることで着順を予想しました。前走各馬出馬したレースと条件が異なるため前走の基準タイムの分布も異なっているはずです。つまり、単純に比較できないのではないかという問題です。


まとめと今後について

今回は、前回作成した基準タイムを使って着順の予想を行いました。とてもシンプルな方法である反面、もう少し慎重に予想方法を考える必要がありそうにも思います。しかし、実用においては今回のように単純に比較して手軽に着順を予想したいものです。
今後は、これらの問題について解決する方法はあるのか、予想精度を改善することができるのか考察及び挑戦していこうと思います。


よろしければサポートをよろしくお願い致します。いただいたサポートは今後の技術向上のために書籍費用等に当てられ、このnoteで還元できればと思います。