見出し画像

サラブレッドはデータで要約できる?

正月はゆっくりできていいですね。
さてサラブレッドの世界は種牡馬の勝ち上がり率等データを要約していることが多いですね。データを要約するとはどういうことでしょうか?要約は、文章の要点を取りまとめることや、その取りまとめたもの自体をさす言葉です。つまりデータがある中で取りまとめて見やすく判断しやすくしたものです。一番わかりやすいのはアンケートを取ったとしてその集団の年齢の中央値を見ることは要約の1つですね。要約するときは代表値(平均、中央)や割合、率などがあります。データを見るときに大事なのは実は添いのデータ集団がどんな分布をしているか?を見て決められます。実は世の中には正規分布といわれる非常にきれいに左右対称になっているデータが少ないのが現状です(理系っぽいですが実は経済学部でも習うんですよ)人はすぐにわかりやすく説明しようとして要約しますがデータサンプルが少ないほど判断するのは危険であるといわざろう得ません。
表題の写真はエピファネイア産駒の年齢別成績です。下の写真は同時期に種牡馬デビューしたキズナ産駒です。確かに古馬になってからエピファネイア産駒が苦戦している傾向があると見えますね。サンプルがほぼ同じなので参考にはなるかなと思います。

ここでまずサラブレッドのデータは分布するとすごく外れ値といわれる値が多いこと、いろいろな要素(育成、気性、母馬)があり一概にはデータを見て決めるというのは賛同できないと思っています。一般的にはバイアスとか交絡と言われます。
評論家さんにはすぐデータを要約される方が多くかえって分かりづらいというのを気が付かれている方は少ないです。
結論を言うとサラブレッドはいろんな要素があって比較しにくいので客観的にデータを見るよりは主観的に見た方が良いのでは?と思っています。
実例をあげますと

  1. 馬券予想 調教、勝負度合い、騎手、ローテ、トラックバイアス

  2. 一口出資選定 血統、厩舎、測尺、動画、募集価格

思いつくだけで様々な要素が入り乱れてデータで傾向は見れても判断はしにくいのでは?というのが最近の結論です。馬券予想家や一口評論家のデータは信じずに自分の好きな馬を買うという行為が一番でないかと思います。

この記事が気に入ったらサポートをしてみませんか?