見出し画像

【競馬AIのお勉強】血統データをスクレイピング+弥生賞振り返り

本日も競馬予想で始めるデータ分析・機械学習さんの動画で勉強。

今回は2019年に出走した競争馬の血統をスクレイピング及び加工する回。
動画内だとカテゴリ変数にするタイミングとダミー変数にするタイミングが一度ぐちゃぐちゃになって混乱したものの特に大きな問題はなく。

1年で出走する馬が11000以上いるのでスクレイピング作業には時間がかかります。年数を増やしていく場合は継続出走する馬もたくさんいるので基本デビュー組を追加していく形になるのかなと思っています。

そして昨日の弥生賞、前回の記事で本命グリューネグリーンといったのでそりゃそうって感じですが外しましたね。弥生賞が終わってもまだまだいまいち分かりづらい3歳路線ですが、今回気になったのはトップナイフとアームブランシュ。トップナイフは今回逃げ馬の締めで抜け出すのに一瞬苦労して2着でしたが走る気持ちが強いのとアームブランシュはあそこからぐんぐん伸びていきそうな脚色だったので皐月ダービーより菊花賞で注目していきたいこかなとおもっています。

アームブランシュは皐月が例年のように展開が流れるならおもしろいかも。
あとはタスティエーラはじめ共同通信杯をものさしにするとどこかで復活のガストリックがみられそうな気がしなくもないという気持ちでいます。

いただいたサポート費用は書籍購入など自学に使用させていただきます。