見出し画像

【競馬AIのお勉強】ランダムフォレストとLightGBMを使用しての分析

サムネは昨年の有馬記念。古谷徹さんの生朗読を4Rと5Rの間にやってました。無料で聞けるなんてとても贅沢…

本日も競馬予想で始めるデータ分析・機械学習さんの動画を見ながら写経

今回のテーマはランダムフォレストとLightGBMを使用して決定木や勾配ブーストでレースにおける3着以内に入る馬を予測しよう。というもの

第4回でロジスティック回帰をやってもいるので、分析時のコード入力も少しずつ慣れてきたというか、あ、ここは公式みたいに覚えておかないと行けなさそうみたいな感覚を持ってみることができるようになってきました。

あと、エラーが出ても冷静にここら辺ではこの作業をやってるから、、あ、こここういう風にやってたらダメじゃんって見直して気づけるようになってきた気がしてます。

具体例として3着以内を1。4着以降を0とすることで分けるはずが1、0に分けた後に同じ作業をやってたせいで分析するデータに1しかおらん!ってなってグラフがうみだされなかったという敗北を1回。

やって面白かったのが方法によって予測にどの要素が影響するかが変わること。どちらの方法でやっても今ある要素だとオッズや人気、騎手の影響度が高いんですが、ランダムフォレストだと川田やルメールなどなどに対してLightGBMだと藤田菜七子や坂井瑠星など…当時の若手がなんか多い。後石神さんみたいな障害ジョッキーも。なんでなんでしょうね。

ランダムブースト
LightGBM

あ、坂井騎手G1、3勝目おめでとうございます。初G1から3勝目までが最速だそうで言われてみればとったG1全部違う馬だし路線も異なるから珍しいパターンな気がしてます。

次回は特徴量を増やすために再びスクレイピング。時間かかるので寝る前などにできると良さげな気がしています。

いただいたサポート費用は書籍購入など自学に使用させていただきます。