見出し画像

競走馬の血統をデータ分析してみた

普段は画像分類AIによる馬体診断を記事にしている本noteアカウントだが、今回は競走馬の血統をデータ分析してみた話をする。
書いているうちに非常に長くなったので、よほど興味がある場合を除きデータをチラ見しながら最後のまとめだけ読むぐらいを推奨する。

血統理論と言えばインブリードやニックスをはじめとして、名馬に共通する配合の法則性を見つけてそれを再現したり評価するための理論だと理解している。ただ、Wikipediaの競走馬の血統にも以下のように書いてある通り、統計的な裏付けをもとに説明されたものがほとんどなく、少ないサンプルをもとにしたものや、活躍例のみを挙げているのが多いという印象を以前より持っていた。著者不明のWikipediaながら、すごく共感できる。

サラブレッドの競走能力と血統の相関関係を体系化する際に、厳密な意味での統計学的手法が用いられることは、ほとんど皆無である。統計学的手法は、これまでサラブレッドの世界に持ち込まれることがなかったか、あるいは無視されてきた。この事実は血統理論が科学的な理論と見なされない致命的な要因である。

Wikipedia「競走馬の血統」より

そこで、少なくとも100頭、できれば1000頭以上という単位で共通する配合条件での結果を集計して比較した資料が見てみたいというのがこの分析を始めてみたきっかけである。とは言え一般人にあたれる詳細な競走馬のデータと言えばJRA-VAN程度であり、また筆者は統計学についても専門外なので、データ分析などと言ってもやっていることは素人の域を脱しないものであるということは先にお断りをさせていただく。もっと言うと競走馬の血統理論にも詳しいわけではない。
表題写真は、社台スタリオンステーションでのディープインパクトとクロフネ。(2014/10/10撮影)

1. 統計データの作成および集計方法

データ集計の対象馬は、2004年から2018年生まれの競走馬で、JRA-VANに登録されている全15世代73,119頭とした。これは、2003年以前の生まれではサンデーサイレンス直仔が含まれるためそれ以降を集計対象としたかったということと、2018年生まれの4歳シーズン末までであればある程度は生涯獲得賞金の多寡は見えてきており集計に加えても問題ないのではないかという判断による(獲得した本賞金の合計は2023年末までの数値を用いている)。

作業としては、TARGET frontier JVから取り出したデータをエクセルで集計していくという方法をとった。
まず最初にTARGETを使って2004年から2018年生まれの競走馬の獲得賞金と、6代までの種牡馬一覧のリストを作成した。TARGETから競走馬の血統データをリストとして出力する場合、父、母の父、母の母の父、母の母の母ぐらいしか一度に出せない(と思われる)。そのため、別途作成した種牡馬の両親の名前が入ったリスト、繁殖牝馬の両親のリストをエクセルのVLOOKUP関数で次々に参照していき、6代前までの種牡馬名を補完することでリストを作り上げた。その場合、特に繁殖牝馬では同名馬から間違った父母を参照してしまうという問題も発生するのだが、そこは手動である程度許容できる範囲まで間違いを除いていった。完全に参照間違いを取り除けていないだろうが、少なくとも集計結果として大きく影響出るレベルにはないと考えている。
なお、TARGETで検索するとジャパンカップなどに出走した海外調教馬も一緒に出てくるが、当該レースのデータしかなく対等な比較ができないので集計からは除外した。

また、競走能力をどのような指標で評価するかというのは最後まで妥協を重ねたところだ。最終的には獲得賞金(本賞金の平均、本賞金の第3四分位、1走あたり賞金の平均)と勝ち上がり率で見ることとしたが、必ずしも能力がそれらの数値に反映されるわけではないこと、正規分布には程遠い偏りが出る(賞金ゼロが最頻値となる)などの問題がある。ただ一般にデータとして得られる数値からすると、それらが最も競走能力を表すのに近いだろうということから上記指標を使用することに決めた。
上記に加えて偏差指数という独自の指数を決めてこれも参考として見てみることにした。これは、インブリードによる狙いとその効果を見てみたかったからなのだが、本来は分散(または標準偏差)を見るべきところ、うまく測定ができなかったので独自指数としたものである。特に、強いインブリードを行う理由としては、競走能力の平均が下がるリスクは承知で一発大きな結果を出したいという狙いがあるものと理解している。インブリードにより産駒の競走能力の分散(標準偏差)が実際に大きくなっているかを獲得賞金で評価しようとすると、最頻値が0のデータ群であるためかほぼ平均値に近い値が標準偏差として出てしまい正しく評価できない。そのため、
 (賞金平均値ー賞金第3四分位)÷(賞金第3四分位)
を偏差指数として、これが大きい場合には少数の優秀な産駒で平均値を吊り上げている=分散が大きいとして、爆発力のある配合と考えることにした。

ここで本賞金の第3四分位という数値を使用したことについても説明しておく。競馬界で言えば競走馬のセール落札金額、一般的なものでは個人資産の所有額など、上にいくにつれて極端に数値が大きくなる分布が見られるときは中間値も評価指標の一つとして使うことが多い。しかし競走馬の本賞金を中間値で見てしまうと、勝ち上がり率が50%に満たないために勝ち上がれなかった馬の獲得賞金で比較することになってしまい、あまり欲しい情報が得られない。(そこそこ走るレベルでどのくらい稼ぐのか、というのを同じ順位で比較して見たいという要望を満たせない。)そこで50%の順位にあたる中間値ではなく、上位25%の順位にあたる「第3四分位」という数値を採用し、勝ち上がれた馬同士での比較をすることにした。
また、勝ち上がり率については収得賞金が0ではない馬を勝ち上がり扱いとしており、中央所属時に勝利した馬だけでなく、地方所属時に勝ち星をあげてJRA-VANで収得賞金が加算されている馬も勝ち上がり対象に含めている。

2. インブリードの数や濃さによる影響

まず最初に、サラブレッドの血統を学んで最初に覚える言葉と言ってもいいインブリードの影響について見てみたい。
データ分析用のリストを作る際に、データ量削減のため6代の種牡馬名のみを入れたので、繁殖牝馬のインブリードについては集計に含めていない。種牡馬と比較すると対象数が十分に少なく、統計結果には大きな影響を与えないだろうという判断による。
また、インブリードの定義としては、近親交配を行うことで対立遺伝子の劣性(潜性)ホモ接合体を出現させて競走能力を高めるのがその目的と考え、父または母いずれかの血統表内のみに共通の名前がある場合はインブリードとみなしていない。

2.1 インブリードの数による影響

血統表内にあるインブリードの数によって競走馬を分類し、その数ごとにどの程度の競走成績が得られたかを集計したものが以下の表2.1である。対象とする全73,119頭の平均を一番上に記し、その下に5代血統表および6代血統表の中で発生する種牡馬のインブリードの数ごとに集計結果をまとめた。上で述べた評価指標の数値に加えて、本賞金の最大値と、その金額を稼いだ「代表馬」も参考として加えている。評価指標のうち、平均の本賞金と勝ち上がり率についてはそれぞれ図2.1と図2.2のようにグラフでも表示した。
また、ここでのインブリードの数は、通常の血統表で表示される数とは異なっている。例えばサンデーサイレンスの3x3を持つ場合、その父であるHaloの4x4は表記しないのが通例だが、この表ではHaloの4x4も、さらにその父のHail to Reasonの5x5も集計に加えるようになっている。これはエクセルで集計する際にダブりを考慮して削るのが困難だったからというのが本当の理由なのだが、濃いインブリードがある場合にそれを数の上でも表現できるということになるので結果オーライとも考えてそのまま採用した。

表2.1から、獲得賞金においても、勝ち上がり率の面から見ても、血統表内のインブリードの数は少ないほうが良い成績を上げられるという傾向が明らかに見て取れる。5代血統表であればインブリード数2~3本、6代であれば6~8本ぐらいまでならば有意差がない程度と言えるが、インブリードの数がそれを超えると徐々に成績が低下していくのが分かる。
6代インブリード数が20本の場合のみ、局所的に獲得賞金も勝ち上がり率も高くなっているが、これは当然このインブリード数を持つと良い結果が出るというわけではなく、たまたま優秀な馬が集まっただけだろう。ここの対象頭数は138だが、この数でもこのような偏りが出ることから、100頭程度のサンプル数があってもデータ分析には十分と言い切れない場合もあるのはこの先の分析でも注意しておきたいポイントだ。
また、独自指数として計算した偏差指数を見ると、ばらつきはあるもののインブリード数が多くなるにつれて指数が若干ではあるが大きくなる傾向が見られる。このことから、インブリードの数が多くなると能力のばらつきが大きくなり、極端に能力の高いor低い馬が出る確率が上がるとみられる。

表2.1  5代/6代血統表内のインブリード数と競走成績
図2.1  5代/6代血統表内のインブリード数と平均本賞金額
図2.2  5代/6代血統表内のインブリード数と勝ち上がり率

同じような調査になるが、5代/6代血統表内の種牡馬の重複数ごとの競走成績を集計し、表2.2にまとめた。重複数0というのが血統表内の全ての種牡馬が異なる場合となるが、繫殖牝馬は集計外なので必ずしも完全アウトブリードという訳ではない。インブリードでの調査と同様、図2.3と図2.4で平均の本賞金と勝ち上がり率を図示した。
こちらも表2.1での集計と同じように、インブリードが発生しないよう血統表内の種牡馬の種類は多いほうが良く、重複が多くなるほど平均成績が落ちるのが明らかに見て取れる。偏差指数による傾向も同様で、インブリードの数が増えると能力のばらつきが大きくなるのが分かる。
なお、6代まで遡ると種牡馬の重複がないような馬はそうそういないだろうと思っていたが、約7万頭のうち106頭存在した。重複が1頭だけという競走馬も425頭と少ないが、その中からダービー馬が出ているのは素晴らしい結果なのでは…と言いかけて、少ないサンプルから結果を語るのではなく、もっと大きなデータから平均的な傾向を見るというのが本来の目的なのを思い出して言葉を飲み込む。

表2.2  5代/6代血統表内の種牡馬の重複数と競走成績
図2.3  5代/6代血統表内の種牡馬の重複数と平均本賞金額
図2.4  5代/6代血統表内の種牡馬の重複数と勝ち上がり率

もう一つ、別の角度から集計した結果を見てみる。
高額賞金獲得馬は、全馬平均に比べて血統表内のインブリードの数や種牡馬の重複数に違いがあるのかという点で集計してみた。その結果が下の図2.5および図2.6で、獲得した本賞金が1億円以上の馬(1,786頭)と5,000万円以上の馬(5,447頭)については、やはり全体平均よりもグラフの山が左に寄っており、高額賞金獲得馬はインブリードの数も種牡馬の重複数も平均すると少ないということが読み取れる結果となった。

図2.5  高額賞金獲得馬の6代血統表内のインブリードの数
図2.6  高額賞金獲得馬の6代血統表内の種牡馬の重複数

上記の表2.1-2.2および図2.1-2.6を読むと、一般的にはインブリードは少なければ少ないほうが良く、敢えて狙うものではなくむしろ避けるべきものという結論が得られる。
ただし、ここでは特定の種牡馬ごとの要素を考慮せずインブリードによる効果を一緒くたにまとめて見てみたものであるため、インブリードに向く馬、向かない馬を調べるなど個別の評価も行う必要がある。そちらについては後ほど紹介する。

また、この統計データに含まれるのはJRAに競走馬として登録された馬のみだということも考慮に入れておきたい。インブリードの影響は、受胎率、出生率、さらには出生後に無事に競走馬として登録されるまで健康に育つ確率についても低下させる方向にあると考えているが(データなし、主観のみ)、それが正しければ生産者の視点からは上にまとめた表・グラフよりさらにインブリードの弊害が大きいと感じているのではないかと想像する。

2.2 インブリードの濃さによる影響

続いて、インブリードの濃さによる分類で競走成績をまとめたのが下の表2.3である。こちらもインブリードの数の調査と同じように、特定の馬の3x3を持つ馬はその親にあたる馬の4x4も持つため、その分類にも自動的に集計されるようになっている。

表2.3  インブリードの濃さと競走成績

先ほどの調査と同じような結果であるが、事前の想像通り濃いインブリードを持つ馬は獲得賞金も勝ち上がり率も悪くなる傾向がみられるため、世代の近い強いインブリードは極力避けるべきというのが一般的な答えと言えるだろう。偏差指数についても想定の通りで、インブリードが濃いほど競走成績のばらつきが大きくなり、極端に強いor弱い馬が出やすくなるように見える。ただしここでもカテゴリー毎のばらつきが大きく、濃いインブリードである2x4や3x3では偏差が小さくなっている傾向も出ている。
平均で見たときにインブリードがどのぐらいまで薄くなれば問題なさそうなレベルかと問われると、3x4以降となるだろうか。3x3ぐらいになるとかなり成績が悪くなるので、3x3と3x4の間には平均として見て大きな差があると言える。競馬界では、3x3はリスクが大きく、3x4が許容範囲という考えが浸透しているように感じているが、統計は取らずとも生産者側も同様の結論を個々の経験から得ているのではないかと想像する。
また、同表の下のブロックでは同じ濃さのインブリードを2本以上持つ場合の成績を出してみた。こちらも傾向としては同じでインブリードが薄いほうが競走成績が良く、また同じ濃さでは2本以上持つ場合のほうが成績が落ちるという傾向が見られる。

2.3 母馬のインブリードの数による影響

インブリードの数による産駒の影響についてはもう一点、親世代のインブリードの数についても見てみたい。
2x3などの濃いインブリードを持つ馬は、繁殖に入って優秀な成績を残すと言われることがある。その代表例としてLady Angelaの3x2というインブリードを持つノーザンテーストが種牡馬として大成功したことなどが挙げられる。
当該の競走馬としてはインブリードの数は少なく、薄くなるほうが平均的には良い成績を上げられることがデータとして確認できたが、親が濃いインブリードや数多くのインブリードを持つ馬の成績はどうなっているかについても調べてみたい。父基準で見ると産駒の頭数によって結果が左右されそうなので、母馬のみでインブリードの濃さや数と産駒の競走成績の関連を見ることにした。

その結果を集計したのが下の表2.4および図2.5-2.8である。最初のブロックが母馬のインブリード数、2番目のブロックが母馬の5代血統表内の種牡馬重複数、3番目のブロックが母馬のインブリードの濃さごとの産駒の競走成績を示したものである。これを見ると、当該馬での調査結果とは対照的に、母馬自身のインブリードが濃く、種牡馬重複数が多いほうが僅かながら獲得賞金も勝ち上がり率も良い成績を上げているのが分かる。インブリード数、重複数が8以上になると顕著に成績が落ちたり、濃さの点でも3x3に限っては成績が落ちる結果が見られるのが気になるところではあるが、2.1, 2.2節でインブリードや種牡馬の重複が少ないほうが成績が良いという結果があることも加味すると、親自身の血統には強いインブリードのあるほうが産駒の成績が上がる傾向にあると言っていいだろう。
これは、優秀な種牡馬の遺伝子を濃くしながらも当該産駒にはインブリードが発生せず、劣性ホモによる負の影響が出ないことがその理由であろうか。いずれにしても、何代も配合を重ねて行く中で、常にインブリードを避け続けるのが最適解でもないというのがこのデータから言えそうだ。

表2.4  母馬の5代血統表内の種牡馬重複数、インブリード数、インブリードの濃さと産駒の競走成績
図2.5  母馬5代血統表内のインブリード数と平均本賞金額
図2.6  母馬5代血統表内のインブリード数と勝ち上がり率
図2.7  母馬5代血統表内の種牡馬の重複数と平均本賞金額
図2.8  母馬5代血統表内の種牡馬の重複数と勝ち上がり率

3. 特定種牡馬のインブリードの効果

次に、個別の種牡馬ごとのインブリードの効果について見てみたい。
代表的な種牡馬について、6代血統表内にその種牡馬を持つ馬と、その種牡馬のインブリードを持つ馬の成績を並べたのが表3.1である。特定の馬を血統表内に持つ馬が黒文字、その馬のインブリードを持つ馬が赤文字で示してある。
インブリードを持つ馬の数でも100を下回らないような種牡馬を選んだが、生年が古い馬では6代血統表にも名前が上がらず、正確な数が出ない可能性はあるのでご理解願いたい。

表3.1  特定種牡馬のインブリード持ち馬の競走成績

表3.1を見ると、インブリードがあるほうが成績が下がるケースのほうが多いが、これは前述の通り「一般的にはインブリードはないほうがいい」という結論に合致する。具体的には、38例のうちインブリード持ちのほうが全ての評価指標(賞金・勝ち上がり率)が高いのは4例のみで、それもLyphard, Nureyev, Sir Gaylord, Sir Ivorということで、ディープインパクトやキングカメハメハを血統表に持つ良血馬の割合が上がって数値を押し上げたのでは?という感じだ。逆にインブリードがある場合に全ての評価指標が下がるのが38例のうち20例と過半数だった。
また、独自作成の偏差指数を見ると38例中21例でインブリード持ちのほうが指数が大きく、成績にばらつきが大きくなるパターンが過半数となった。ただし全体の55%でしかなく、もっと圧倒的にインブリードありのケースが成績にばらつきを生じると思っていたので少し意外な結果である。この指数の妥当性は判断が難しいものの、平均的に見ると強いインブリードでなければ思ったより競走能力のばらつきは大きくないのだろうか。

単純に獲得賞金や勝ち上がり率を見ても種牡馬によって様々な結果を示しているのだが、中でも特に気になったのがサンデーサイレンスである。全ての指標でインブリード持ちのほうが成績が落ちる。ようやく3x4のインブリードが珍しくなくなり、これから本格的に増えるだろうという時期ではあるが、表にある数値ほどインブリード持ちに対して悪いイメージがなかったので、もう少し掘り下げて調べてみることにした。
調べてみた結果をまとめたのが表3.2で、まず上のブロックでインブリードの濃さについて見てみた。すると、明らかに3x3の競走成績が悪く、3x4では賞金で見れば決して悪くない結果となっているのが分かった。3x3などの強いインブリードでは一般的には競走成績が低下する方向にあるという前章での調査通り、サンデーサイレンスのインブリードでも3x3は避け、3x4以降にとどめるのがよいというのがこの結果からも分かる。3x3の割合の多さに引きずられる形でインブリード馬全体の成績が落ちているというのが主な原因と言えるだろう。
このように、まだ代を深く重ねることができない種牡馬では強いインブリードの割合が比較的多くなり、結果としてインブリードが良くないという誤読をする可能性があるので注意が必要だということが分かる。表3.1を見直してみても、1980年代以降に生まれた種牡馬は、全てインブリードしたときの成績が落ちている。これらの種牡馬がインブリードされたときにプラス・マイナスどちらの効果を与えるのかを判定するには、まだあと10年ぐらいの時間は必要なのかも知れない。

次に表3.2の下2つのブロックで、ノーザンファーム(以下NF)産とその他で分けて成績を比べてみた。NFの生産馬であればサンデーサイレンスのインブリードでも走っているというイメージからこのような比較をしてみたのだが、NFとそれ以外というかなり雑な分類でも興味深い結果が得られた。
NFでもやはり3x3のインブリードではあまり結果が出ず、NF生産馬の平均を下回る成績になっているが(それでも全平均よりは上)、3x4のインブリードでは獲得賞金においてNF生産馬の平均を上回る結果を出している(勝ち上がり率では若干落ちる)。NF以外の生産馬では3x3はもちろん、3x4でも賞金、勝ち上がり率ともに全平均を下回る結果となっているので(1走あたりの賞金では平均より上だが)、NFではサンデーサイレンス3x4で成功し、NF以外では3x3だけでなく3x4でもうまく結果を出せていないというのが大まかな傾向として見られる。
それよりも気になったのは、NFとそれ以外での3x3と3x4の対象頭数の違いである。NFでは3x3の頭数は3x4の1/3以下と少ないが、NF以外では3x3のほうが3x4より多い。これには様々な理由があるのだろうが、競走成績は運にも大きく左右されるが生産頭数はほぼ意図した結果によるはずだ、ということを念頭に置くと、NF一強と言われるほど抜けた成績を残せているのも、この結果が表しているところに関係しているかも知れないなんて思ったりもした。またどのカテゴリーで見てもNFの偏差指数が小さいのも特徴的だ。これは能力のばらつきが大きいというよりは高額賞金獲得馬が多いという理由によるものかも知れない。ここまで違いが出ると、この独自指数も能力の分散の評価指数として適切ではないようにも思うが、評価を行う際には少なくともNFとそれ以外の割合には気を配る必要があるだろう。
何度も言うがNFとそれ以外という雑な分け方によるものなので、これ以上一般化して分析結果を語るのは控えておく。さらに、血統による統計に生産者による分類を入れてしまうと、育成による影響が混ざってしまい純粋な血統分析にならないということも十分に理解しておかねばならない。

表3.2  サンデーサイレンスのインブリード詳細比較

気になったデータとしてサンデーサイレンスのインブリードに関する調査結果を簡単にまとめて紹介したが、その他にも集計結果を鵜呑みにできないデータはあるように思える。上でも述べた通り、インブリードの効果が高く見える馬でも、ディープインパクトやキングカメハメハによる影響がどの程度あるのかを見ておかないと信頼に足るデータとはならないなど、集計結果の解釈には注意を要するところが多々あるだろう。

4. ニアリークロス等の影響

同じ馬ではなく、血統構成の近い馬同士をインブリードと見立てる血統理論がある。それが父母ともに同じである全きょうだいであれば「全きょうだいクロス」、3/4の先祖を共有していれば「3/4同血クロス」、また共通する先祖を複数有して血統構成が似通っていれば「ニアリークロス」とよび、同じ馬のクロスと同等またはそれ以上の効果があると考えるもので、血統評論家の笠雄二郎氏が提唱し、現在ではその教えを受け継いだ望田潤氏などが広く紹介している理論である。(参考:アーモンドアイの血統表でみる「全きょうだいクロス」「3/4同血クロス」「1/4異系」「配合的な緊張と緩和」
ネット上でもこの理論をもとにして血統解説をしたものをよく見るが、活躍馬の血統表中にこの理論の該当例を認めたという話がほとんどで、統計的に有意差があることをデータで検証したような説明を見たことがなかった。そのため、これらの理論が実際にどの程度産駒の競走成績向上に効果を発揮しているのか、実例をもとに統計データを確認してみることにした。

4.1 全きょうだいクロス

全きょうだいクロスの例では牝馬を含めたケースが取り上げられるのをよく見るが、今回の調査では種牡馬しかデータに含めていないため、種牡馬同士の全兄弟によるクロスの例を使用せざるを得ない。データとして十分な数を持つ全兄弟として、GraustarkとHis Majestyの兄弟で検証を行った。

表4.1がその結果をまとめたもので、3つのブロックはそれぞれ、両馬を血統表に含む馬の成績、両馬のインブリードを持つ馬の成績、そして「ロードカナロアを血統表中に持たない馬のうち」両馬のインブリードを持つ馬の成績というふうに分かれている。

表4.1  Graustark=His Majestyの全きょうだいクロスの競走成績

最初のブロックは両馬を先祖に持つ馬の成績を比較したもの。勝ち上がり率はGraustarkがわずかに上回るものの、獲得賞金ではHis Majestyが優位であるというのが分かる。
次のブロックはそれらをインブリードさせた馬の競走成績を示している。すると両馬の差がさらに大きくなり、獲得賞金・勝ち上がり率すべての指標でHis Majestyのインブリードが上位であった。またその両馬をクロスさせた「全きょうだいクロス」ではどうかというと、ほぼ両馬のインブリードの中間(獲得賞金の平均値のみGraustarkクロスと同じ)となり、His Majestyのインブリード馬の成績を上回るものはなかった。(賞金の最大値は対象頭数にも左右されるのであくまでも参考扱いとする。)
最後のブロックでは、2つ目のブロックと同じ比較を「ロードカナロアを血統表中に持たない馬」のみで行った結果を調べた。これは、ロードカナロア自身がGraustarkとHis Majestyの両方を先祖に持つ全きょうだいクロス馬であるが、ロードカナロア産駒の多寡によってそれぞれの競走成績の平均が大きく左右される可能性があるのではないかという懸念によるものである。結果としては、頭数の割にはロードカナロア産駒による底上げは大きいことが認められるものの、序列を逆転するほどではなく、やはり「全きょうだいクロスは両馬同士のクロスの中間の成績」という結論から変わらないものだった。
また、いずれのケースでも能力の分散を見るための偏差指数まで両馬インブリードの中間となっており、一発大物を当てるという目的においてもデータからは特筆すべきところは見られない。

4.2 3/4同血クロス

次に、父または母が兄弟や親子でもう一方の親が同一となるような3/4同血クロスと呼ばれるケースについて見てみたい。

有名な3/4同血の種牡馬として、NureyevとSadler's Wellsの両馬を検証例に取り上げたい。どちらも産駒を多く残した名種牡馬であり、また現在も5代血統表内に十分収まる世代にあることから、サンプルとして最も相応しいと判断した。両馬の血統表は以下の図4.1の通りで、父はどちらもNorthern Dancerで、Nureyevは母がSpecial、Sadler's Wellsは2代母がSpecialというのが異なる点で、いわゆる3/4同血とされる。
父と母の父が同じでも血統表中は3/4の先祖が同じとなるが、特に優秀な後継馬を複数残した母系が共通するものを重視するとのことなので、名繁殖牝馬であるSpecialを共有している両馬はその条件に該当する。

図4.1  Nureyev血統表(左)とSadler’s Wells血統表(右)

この両馬による3/4同血クロスの影響についてまとめたのが下の表4.2で、4つのブロックはそれぞれ、両馬を血統表に含む馬の成績、両馬のインブリードを持つ馬の成績、「キングカメハメハを血統表中に持たない馬のうち」両馬のインブリードを持つ馬の成績、そしてNFとそれ以外による生産馬での両馬のインブリードを持つ馬の成績というふうに分かれている。
最初のブロックは両馬を先祖に持つ馬の成績を比較したもので、さらに前節のロードカナロアの影響と同じようにキングカメハメハを血統表中に持たない馬に限定したケースでも調べている。
2つ目のブロックは両馬をインブリードさせた馬の競走成績で、さらに3つ目のブロックでは血統表中にキングカメハメハを含まない馬に限定したケースでのインブリード馬の競走成績を比較できるようにした。
最後の4つ目のブロックは、NF生産馬とそれ以外で両馬のインブリード馬の競走成績を比較した表である。

表4.2  Nureyev≒Sadler's Wellsの3/4同血クロスの競走成績

この結果を見ると、全きょうだいクロスの場合と同じように、3/4同血クロスの競走成績は両馬のインブリードの中間の結果を残しているというのが分かる。また全きょうだいクロスの時と同様、能力の分散を見るための偏差指数もほぼ両馬インブリードの中間に位置している。Nureyevがキングカメハメハの血統表に含まれることから前節のロードカナロア同様にその影響を除いたケースでも、またNF生産馬とそれ以外で分けたケースでも調べてみたが、どちらも同じような結果が見られた。(NF生産馬では勝ち上がり率が3/4同血クロスが最も低くなっているが、Sadler's Wellsのインブリード馬が少ないため有効な統計結果とはみなせないと考える。)

4.3 ニアリークロス

もう一つ、血統表内に共通する先祖を複数有しているようなニアリークロスのケースについても検証を行ってみた。

ニアリークロスについては対象となる組み合わせは多数あるようだが、対象例もそれなりの数があり、ディープインパクトの血統表にも見られることで知られる Halo ≒ Sir Ivor ≒ Drone の3頭のニアリークロスの組み合わせで検証してみることにした。
この3頭によるニアリークロスの影響についてまとめたのが下の表4.3で、2つのブロックはそれぞれ、3頭を血統表に含む馬の成績(ディープインパクトを血統表中に持たないケースも別途表記)と、3頭のインブリードとニアリークロスを持つ馬の成績(ディープインパクトを血統表中に持たないケースも別途表記)の比較となっている。前節の3/4同血クロスでの検証と同じように、ディープインパクトの血統表にHaloとSir Ivorを含むため、この影響を確認しておくのが目的である。

表4.3  Halo≒Sir Ivor≒Droneのニアリークロスの競走成績

3頭の組み合わせになるとチェックする箇所が多くなるが、やはりこれも「ニアリークロスを持つと競走能力がアップするとは言えない」という結論になると言えるだろう。
ディープインパクトの影響を含めた場合で見るとSir Ivorのインブリードが圧倒的な成績なのでなかなか断じにくいところがあるが、ニアリークロスを持つ馬の賞金・勝ち上がり率はほぼ対象2頭の中間の成績に位置していたり、3頭を含むニアリークロスを持つ馬が同じ馬のインブリードやニアリークロスの組み合わせの中でも下位の成績になっているというのがその理由である。(3頭のニアリークロスを同時に持つとより効果が高いのではないかと思ったが、特にそのような理論ではない?)
このことから、少なくともHalo ≒ Sir Ivor ≒ Droneの3頭によるニアリークロスについては、今回の集計結果の範囲では特に競走成績を向上させるというデータは確認できない。

5. 1/4異系

前章と同様に、笠雄二郎氏の提唱する血統理論の検証として、1/4異系について検証してみたい。これは「配合的な緊張と緩和」という概念の一つで、優秀な種牡馬の遺伝子をインブリードで濃くしていきながら、一方で近親交配の弊害を除くために縁遠い血統の種牡馬の遺伝子も取り込んでいくという考え方である。具体的には、4頭の祖父母のうち1頭だけが他の3頭と異なる血統背景を持つ場合に競走能力が向上するというもので、例えば祖父母3頭がアメリカ血統で他の1頭のみバリバリの欧州血統といったものだろうか。
ただし、今回行ったエクセル集計ではそのような血統背景による分類は難しいこと、また前章のリンク先での説明では祖父母4頭のうち1頭だけ特定の種牡馬を含んでいないような場合にも適用できるという見解が示されていることから、特定の種牡馬を祖先に含むか否かということを判断基準にして異系を割り出して調査していくことにしたい。

5.1 特定の種牡馬の1/4異系

特定の種牡馬の1/4異系に該当する馬の競走成績を調べた結果が下の表5.1である。ここで「Northern Dancer 1/4異系」としているのは、祖父母4頭中3頭は先祖にNorthern Dancerを有し、1頭だけNorthern Dancerを持たない「3/4 Northern Dancer」という意味である。
祖父母4頭中1頭だけ共通の先祖を持たないということは、その馬のインブリードを少なくとも2本は持っているということなので、比較対象としてその馬のインブリードを持つ馬のデータと、祖父母4頭全てが当該馬を先祖に含む馬のデータを並べた。ただし、後者は該当なしの場合や該当するのが十数例しかない場合があったので、それらは表から除いている。
Nijinskyの勝ち上がり率や、Secretariatの賞金・勝ち上がり率など、1/4異系のほうがインブリード全頭平均を上回る成績のものがあるが、そのほとんどが対象頭数200以下のものなので、統計的に十分なサンプル数とは言い切れない。その中でも十分なサンプル数をもとに差が出ていると言えそうなのがNorthern Dancerの賞金とMr. Prospectorの賞金・勝ち上がり率で、それぞれサンプル数は20,000弱と800超で、特にNorthern Dancerについては十分すぎる数がある。この2頭による1/4異系について、もう少し掘り下げてみる。

表5.1  1/4異系の競走成績

5.2 Northern Dancerの1/4異系

まずNorthern Dancerについてだが、祖父母のうち1頭だけ非Northern Dancerというと、そこにサンデーサイレンスが当てはまるのではないかというのが真っ先に思い当たる。
そこで、祖父(父父or母父)がサンデーサイレンスのケースとそれ以外に分けて、それぞれNorthern Dancerの1/4異系になっている馬と対象全馬とで競走成績を比較してみたのが表5.2である。すると、やはり祖父サンデーサイレンスとそれ以外では競走成績に圧倒的な違いがあったので分けて比較するのが正解だったわけだが、いずれのケースでもNorthern Dancerの1/4異系のほうがほとんどの評価指標が全馬平均より高いことが分かった。(つまり、祖父サンデーサイレンスという優秀な種牡馬により異系を作ることで平均値を上げているわけではないということ。)祖父が非サンデーサイレンスの場合はそれほど大きな差は生じていないが、祖父サンデーサイレンスでその他3/4にNorthern Dancerを持つような1/4異系では、全ての評価指標で有意な差が出ている。
このことから、3/4 Northern Dancerとなるような1/4異系は競走成績を高める効果があり、さらに祖父がサンデーサイレンスの場合により大きな効果を発揮すると見ていいのではないか。

表5.2  Northern Dancerによる1/4異系で祖父サンデーサイレンスか否かによる分類

5.3 Mr. Prospectorの1/4異系

次に、Mr. Prospectorの1/4異系についてもデータを掘り下げて見てみる。
Mr. Prospectorの場合、Northern Dancerにおけるサンデーサイレンスほどの大きな存在がないので、Mr. Prospectorのインブリード数の多さで分類してみた。
その結果が表5.3なのだが、これを見ると単純に血統表中のMr. Prospectorの数が多いほうが賞金や勝ち上がり率が高いという傾向が見られることが分かる。表5.1を見る限りでは、Mr. Prospectorの1/4異系は同馬のインブリード持ち平均より成績が上だというのが読み取れるが、それは単に先祖にMr. Prospectorの数が多いからというのがその理由であるように思われる。その証拠に、Mr. Prospectorの1/4異系よりも祖父母4頭全てがMr. Prospector持ちの方が(僅か40頭という参考例でしかないが)全ての評価指数で上回っている。また、血統表中のMr. Prospectorの数が1から4へと増えるにつれて評価指数のほとんどが一様に向上している。
このことから、Mr. Prospectorの1/4異系に関しては特に異系血脈を持つことにより競走能力が上がるとは今のことろ言い切れない。ただし、全祖父母がMr. Prospector持ちという例が今後増えていくにつれて、やっぱり1/4異系の効果はあるという結論に変わる可能性はまだ十分に残っている。
ちなみに、Northern Dancerでも同じような分類で比較してみたが、ここまで顕著な差が出ていないので結果の紹介は割愛する。

表5.3  Mr. Prospectorの重複数による影響

5.4 特定の2頭の種牡馬による1/4異系

前述の5.1-5.3節では1頭の種牡馬を対象に1/4異系とみなして競走成績を調査したが、1頭の種牡馬よりは「祖父母のうち3頭は種牡馬A, Bともに先祖に持つが、祖父母のうち1頭だけは種牡馬A, Bいずれも持たない」という2頭同時に1/4異系となるような条件があればより異系としての質が高まるのではないか?という仮説を立て、そのような条件に当てはまるケースでの競走成績を調べてみることにした。
2頭同時という条件では合致する産駒の頭数はどうしても限られてしまい、最大でも200超ぐらいの頭数でしか検証できないのは残念であったが、「Northern Dancer & Mr. Prospector」、「Northern Dancer & Hail to Reason」および「Northern Dancer & Bold Ruler」という3組で調べた結果が以下の表5.4である。非Northern Dancerかつ非Bold Rulerという条件にはサンデーサイレンスが当てはまるため、これについては祖父サンデーサイレンスとそれ以外で分けた結果も表示している。

表5.4  2頭による1/4異系の競走成績

2頭同時に1/4異系になる条件にすると、多くても200頭ぐらいしか揃えられないのでデータの信頼性に疑問は出るものの、少なくとも「Northern Dancer & Mr. Prospector」および「Northern Dancer & Hail to Reason」の2例については獲得賞金、勝ち上がり率ともに良い結果を出せていない。と言うより、「Northern Dancer & Hail to Reason」に至ってはそれぞれの1/4異系よりも全ての指標で低いのが見られることなどから、より異系としての質が高まるこの条件であれば競走能力を上げる効果も高まるだろうという考えは当てはまらなかった。

6. ニックス

ニックスと呼ばれる種牡馬同士の相性の良さについても、獲得賞金や勝ち上がり率が標準よりどの程度高くなるのか数値で見てみたい。ただし、特定の種牡馬の組み合わせとなるとどうしても該当馬が少なくなり、この分析の当初の目的からやや遠くなってしまうのだが、それでも参考として調査結果を見てみたい。

6.1 ディープインパクト x Storm Cat

ニックスと言えば真っ先に例に上がるのがこの組み合わせ。キズナ、エイシンヒカリ、サトノアラジン、リアルスティール、ダノンキングリー、ラヴズオンリーユー等々、一流馬を多数輩出した近年最も有名なニックスである。その成績を、他の判断材料となるようなデータとともにまとめたのが表6.1である。

表6.1  ディープインパクト x Storm Catのニックスによる競走成績

このニックスで生まれた一流馬として上に挙げた例はいずれも父ディープインパクト x 母の父Storm Catという組み合わせなのだが、その成績がとんでもなく素晴らしい。62頭しかいないとは言え獲得賞金額は抜きんでた数値であり、父ディープインパクトおよび母の父Storm Catといういずれも平均を大きく上回る要素の組み合わせではあるが、それを考慮に入れても文句のない成績と言える。

ただ、父ディープインパクトに母の父の父Storm Catという配合では全ての指標で父ディープインパクトの成績を下回っていたり、父の父ディープインパクトと母系にStorm Catを組み合わせた産駒では、父の父ディープインパクト全馬平均と比べても芳しくない成績となっている。現時点では非常にサンプル数が少ないので断定してしまうのは危険だが、今のところこれらの組み合わせでは競走能力を高める効果は確認できない。「ディープインパクト由来の遺伝子とStorm Cat由来の遺伝子を掛け合わせると産駒の競走能力が上がる」というような仮説は正しさが認められない可能性が高く、今後ディープインパクト産駒がデビューすることがない今となっては一口馬主の出資にもPOGにも役に立たないデータとなってしまった。

6.2 ディープインパクト x フレンチデピュティ

もう一つ、ニックスの例としてディープインパクトとフレンチデピュティの組み合わせについても見てみたい。これもマカヒキやショウナンパンドラなどを輩出し、相性の良い組み合わせと言われているようだ。

表6.2  ディープインパクト x フレンチデピュティのニックスによる競走成績

この結果を見ると、母の父Storm Catに負けず劣らず素晴らしい競走成績を上げている。やはり母の父フレンチデピュティというだけで獲得賞金も勝ち上がり率も平均を大幅に上回る成績を上げているのだが、勝ち上がり率に至ってはニックスではない母父フレンチデピュティでは母父Storm Catを下回る一方で父ディープインパクトとのニックスになるとStorm Catのそれを上回るというより優れた成績を出していると言える。しかも父ディープインパクトx母父父フレンチデピュティという組み合わせでは、勝ち上がり率が母父フレンチデピュティのニックスよりも高いという現象まで出ている。
ただし、Storm Catでのニックス以上に対象馬が少なく、データの信頼性という意味ではさらに低いという点は注意が必要である。

7. まとめ

今回使用したデータ数で分析可能なこと
結論から言うと、十分なデータ数をもとに分析すると有意差のある結果は得られにくく、有意差のある結果が出るものはほとんどデータ数が限られる条件ばかりだったという、ある意味予想通りの結果であった。
血統構成と競走能力の相関についてデータから信頼のおける結論を出そうとすると、1000件程度の例は必要になってくる。特定種牡馬によらないインブリードの数などについては十分な数のデータを出せる集計方法があるが、ニックスのように特定の種牡馬の組み合わせの良し悪しとなるとデータ数が少なく、信頼度が著しく落ちる分析しかできない。父ディープインパクトx母父Storm Catという産駒でさえ62頭しか例がなく、ニックスに関しては多くの血統診断で見るように、活躍馬の血統表を詳しく掘り下げて、いかに一般的に通用する仮説を立てることができるかという通常の方法をとるしかないだろう。

インブリードと競走成績の相関
これが今回のデータ分析による唯一にして最大の役に立つ成果と言えるのだが、血統表内の共通する先祖の重複数やインブリードの数は少ないほうが競走成績が良くなるという傾向が見られた。一方で、当該馬の親の血統表について見た場合には、むしろインブリードが「濃い」ほうが競走成績は良くなるという傾向も見ることができた。ただし、これらの差異は「ディープインパクト産駒か否か」といった差に比べれば非常に小さいもので、幼駒の評価の際には血統や馬体などで甲乙つけがたい時に最後に気にする程度で良いのかも知れない。
上記はあくまでも一般化して傾向を述べたもので、特定の種牡馬のインブリードに関してはそれぞれ傾向が異なる。種牡馬によってインブリードがあるほうが平均の賞金が高いもの、勝ち上がり率が高いものなど、様々な特徴があるが、多くはインブリードがある場合のほうが競走成績は悪くなる傾向にあると言える。また、サンデーサイレンスなどまだ代を重ねていない種牡馬の場合は、濃いインブリードを持つ馬が比較的多くなるために競走成績が悪くなるように見えるため、資料を参照する際には注意する必要がある。

ニアリークロス等と競走成績の相関
笠雄二郎氏の提唱する血統理論のうち、全きょうだいクロス、3/4同血クロスおよびニアリークロスという、相似する血統背景を持つ種牡馬同士のクロスについて、それぞれ1例ずつ選定して競走成績を見てみたが、いずれもその効果が認められなかった。
ただし、この結果からこれらニアリークロス等の配合は競走能力向上に全く効果なしと断じるのも早計かも知れない。笠氏の「血統論」の中で、以下のような一説がある。

さて、血統において、いちばん重要なことは何か。
いちばん重要なことは血脈構成が優秀であることだ。良い種牡馬、良いサイアーライン、そして、良い繫殖牝馬、良い牝系を持つことは、育種の目標でもあり基本でもある。部分やクロスを考えるあまりに、このあたりまえのことから逸脱しがちな人が、生産界にも血統研究者にも意外と多い。

笠雄二郎「血統論」より

つまり、全きょうだいクロスがあるからいい配合だ、などと単純に言えるものではないということだろう。それにしても、今回の調査で少しは効果があるという結果が見てみたかった、というのが正直なところだ。ネット上で披露される血統分析にはこの理論を拠り所にしているものも多く見られるので、集計方法を工夫すればこれらの相似クロスの効果があるのを確認できるのかなど、詳しい人に意見を聞いてみたいところだ。

1/4異系配合と競走成績の相関
祖父母のうち1頭だけNorthern Dancerを持たないという条件のみ有意差のある結果が得られたものの、1頭だけ特定の種牡馬2頭を先祖に持たないという組み合わせで調査した結果が思わしくなかったことから、一般的に広く適用できると言い切れるものではなさそうだというのが今回分析をしてみた感想である。
ただし、これについても笠氏の「血統論」から以下の言葉を引用したい。

現代の競馬では、同系がほとんどで、昔のような異系の血が、それも優秀な異系の血が少ない時代では不可能だが、これは優秀な形式だと歴史は語っている。

笠雄二郎「血統論」より

昔のような優秀な異系の血は、すでに現在の競馬界にはほとんど残っていないという意見は納得がいく。繁殖馬も幼駒も大陸をまたいで大きく移動するようになった今日では、遺伝子頻度の違いこそあれ、世界中どこに行ってもほぼ同じ遺伝子プールの中からどの組み合わせを選択して産駒を生産するか、という程度の違いしかないように思われる。
そのため、純粋な意味での1/4異系配合というのは現在はほぼ不可能に近く、今回の調査のような1/4非Northern Dancerで競走成績の平均値が上がるなどの結果で評価するぐらいしかないと言えるのではないか。

ニックスについて
特定の種牡馬同士のニックスについて、父 x 母の父という組み合わせでデータ分析するには、サンプル数が少なくて満足のいく調査はできない。ディープインパクト x Storm Catのような非常に事例の多そうな組み合わせですら100件に届かず、さらにある程度のデータ数が揃った頃には種牡馬を引退するような時期になるため、このような分析には向いていない。やるとしたら数代前の種牡馬同士の組み合わせで試すことになるだろうが、ディープインパクト x Storm Catの調査で父の場合と父父の場合ではニックスの効果が異なるような現象が見られたこともあり、世代を超えて適用できるものを見つけ出すのは難しそうに思える。

外国産の両親の馬データ
これは全くの余談になるが、JRA-VANの種牡馬データでカタカナ名と英語名の馬データが別々に登録されているのは改めてほしいと強く思う。同じディープインパクト産駒でも、海外で産まれたら父名がDeep Impactと表記され、データベース上も異なるID(主キー)で管理されるというのはデータベース設計上の瑕疵と言っていいだろう。国内の馬名登録ルールがそうなっているからというのが理由なのだろうが、データ集計の観点では不都合しかないので今からでも改善をお願いしたい。その点では同一馬が同一IDになっているnetkeiba.comのデータ取り扱いに軍配が上がる。


この記事が気に入ったらサポートをしてみませんか?