②機械学習で使うデータを考える。【競馬ビギナーは三連単的中の夢を見れるか】
ダービーでビギナーズラックあてた競馬素人が
独学の機械学習で予測して競馬三連単的中を目指してます。
『過去データで結果予想するとか無理くね?(; ・`д・´) (減る一方の預金残高を眺めながら)』
皆さん二カ月ちょっとぶりです。
気まぐれ更新なので気長にお待ちいただいてるとうれしいです。
この間何度か手動でデータ集めて予想してみてはいるのですが、
馬券にかける金額に反比例して、的中率は下がり続けています。
当たってもトリガミ(最近コトバ覚えました)とか……。
3頭中2頭は当たるんですよ、買うの3連複とかなんであれですけど。
ちょっとタイムマシンに乗って次のレースの結果とか見て戻ってきたい気分ですw
さて、気分をトリガ……じゃなくて取り直して。
データを取得するサイトは決まりましたが、
ご存じの通り掲載されいている情報は膨大です。
どういう風にデータを取得しようか?
やろうとなれば、競走馬とかレースのデータをごっそり取得できるんですが、データが多いと集める時間も、サーバーへの負荷もかかるので効率が悪い。
なので、予想したいレースを指定して、
都度、その時に関係しているデータを集める感じにしたいと思います。
データ取得の流れ
どういう感じかザックリいうと、
例えば、今度9/20(月・祝)に開催される『セントライト記念』。
その出馬する馬名のリンクから、
・過去の競走成績
・調教師
・血統
あたりを競走馬ごとにデータを収集する。
最後に、それら集めたデータを使って機械学習して、入着する馬を予想する…。
そんな感じでいきたいと思います。
データはどこまで拾うか?
で、予想に必要なデータってどこまでの範囲なのでしょうか?
生産者や調教師も入れたほうがいいのか?
血統ってどの程度成績に影響するのか?
正直、人気順が高いから馬券にからむとかはなさそうなんでオッズの倍率はなくていいと思ってます。
これを始める以前、機械学習を学ぶ理由付けとして、ロトの予想に挑戦してみたことがあります(まぁ、予想と呼べるような結果すら出てきませんでしたが…)が、ロトの抽選球と違って、今回の競走馬は生き物なので、調子がいい時もあれば悪い時もあるし、騎手の指示通りに行かない時だってあると思うんです。
そういった馬自身の傾向は、おそらくデータを見ても直接わからない気がします。パドックを見て予想する方法もあるようですが、それだと開始ギリギリまで待つ必要があるので、今回はその辺の入力は省きたいと思います。
次回更新までにその辺準備しておきたいと思います。
このペースならクリスマス前には多分更新しますのでw
この記事が気に入ったらサポートをしてみませんか?