見出し画像

【競馬AIのお勉強】出馬表に血統データをくっつける

本日も競馬予想で始めるデータ分析・機械学習さんの動画で勉強

netkeibaの出馬表をスクレイピングして形を整えるとこまでが前回ですが、この出馬表血統データがまだありません。なのでくっつけようの回。

ただくっつけるにあたって現実装には問題があります。馬の血統データをこれまでのレースに紐図けて取得しているので初出走の馬はまだ血統データが登録されていないんです。

なので、今は血統データ存在しませんよというアラートを投げるよう処理を入れました。そこだけ改めてスクレイピングしてあげればといいうことです。

しかし今の構造上新馬戦は血統ジョッキー馬体重とかくらいでしか判断できるようになっていないと思ってるけれどそれでいけるもんなのか、とかこの時期の未勝利戦みたいに出走済みの馬と初出走の馬が混在するレースはどう判断されるんだろうとか気になりますね。

こうやって記録に残しつつ実は先の方の動画も目を通したり進めている部分もあるので、早ければ18日土の競馬から予想結果を出力できる形にはなるのではないかなと思っています。

いま厩務員のストライキで行われるんかみたいな状況ではありますが…


いただいたサポート費用は書籍購入など自学に使用させていただきます。