【血統】 種牡馬の特徴を勝利コースデータから理解する
これまでに種牡馬の特徴を整理する方法としていくつか提案してきました。
以下の記事では種牡馬の特徴を『平均勝利距離』と『勝ち星の芝ダート比率』を基準にグループ分けする話でした。
今回はそうした種牡馬の特徴をつかむ道具として、コースデータを使った方法を紹介します。
要するに、勝利時に限定して
1.『直線距離』
2.『コーナーの数』
3.『左右回り』
この3つのファクターの平均値を使います。
芝勝利数50以上の種牡馬のデータ
いきなりデータを見ましょう!
※左右については、左回りを「1」、右回りを「0」としているので平均値が1に近いほど左回りでの勝利が多いと理解してください。
※新潟千直については例外的な数値なので除外しています
見づらいかもしれないのでCSVデータを以下に添えておきます。
なかなか見たことがないデータではないですか?!
ただイマイチかなと思うのは、別の指標と同じ意味を持っているのではないか、という点です。(統計学でいう多重共線性というやつ)
というのも上図の直線距離の低いグループに目をやると、短距離種牡馬が並んでいます。1200mコースは直線の短い設計なので自ずと比例してきます。
同様のことがコーナー数にも言えます。
逆に面白い点を挙げれば、東京が得意?とされるジャングルポケットが特徴的な数値を出しています。
左右の平均値が高い順に並べると、ジャングルポケットが1位になり、直線距離でも3位です。つまり、東京的な直線の長い・左回りコースが得意という特徴は表現されています。
いわば競馬場別の成績データが離散的とすれば、今回紹介したデータは連続的に種牡馬の傾向を把握できる点は強みです。
これを直接的に予想に活かすのは現実的ではないでしょうが、種牡馬のグループ分けなどのファクターとして取り込むと便利かと思います。
ダート版も添えておきますね。
ダート勝利数100以上の種牡馬のデータ
うまい活用法や他にも取り込むべきデータなど、妙案があればコメントいただければ実行してみます。
以上、吉田しげるでした。
元となるコースデータの作成についてはコチラで記しています。
この記事が気に入ったらサポートをしてみませんか?