見出し画像

最強馬ランキングトップ50:統計を用いた競走馬の強さの測定


1.はじめに

こんにちは、yoshiです。この記事は2010年1月1日以降にデビューした競走馬について、統計を用いて測定した競走能力のランキング記事になります。

皆さんは最強馬と聞いてどの馬を思い浮かべるでしょうか。それぞれに重視する指標が異なりますし、思い入れの深い馬を上位に挙げるのではないでしょうか。

時代を超えて最強馬と目される競走馬たちが一堂に会し、順位を決めてくれればなんて妄想を私はよくします。しかし、競走馬には世代があり、また距離などの適正もあるので、そんなことは実現しません。

皆さんは競走馬の強さ・能力を測る際に何の指標を使いますでしょうか?

一般的には、
・勝率や複勝率
・タイム
・獲得賞金

など競走馬の能力を測る様々な指標があるかと思います。

しかし、一つの指標だけではその競走馬の総合的な能力を測定することは難しいです。たとえば、勝率だけであれば出走レースの競争相手に影響を受け、十分なレース数をこなしていない競走馬が有利になります。また、生涯獲得賞金であれば現役馬が不利ですし、タイムだけではレースレベルやペース、ゴール前の位置などに左右されてしまいます。

そのため、競走馬の強さを測定する際には、一つの指標だけでは不十分であり、それらを総合的に考慮する必要があります。その問題を解決するのが主成分分析です。

主成分分析とは、簡単にいうと、複数の指標に共通する因子(主成分)を計算し、それぞれの指標に対して適切に重み付けを行ったうえで、一つ(もしくはもとの指標よりも少ない)指標に要約する手法です。今回は、この主成分分析という統計手法を用いて、競走馬の強さを表すと考えられる指標を総合して数値化してみました

※この記事はまだ分析・執筆の途中となっています。修正・アップデートを行った場合、更新いたします。また、今後、競馬ゲームにあるような、スピードやスタミナなどのように、競走馬の強さを分解し、追加していく予定です。スキ(いいね)・フォロー・サポートなど頂くととても嬉しく、分析・執筆の励みなりますので、よろしければお願い致します。

また、ご要望や質問、アドバイスも受け付けております。お気軽にコメントしてください。

(2021年10月26日時点)

2.集計データ

データ公開日:2021年10月26日
期間:2010年1月1日~2021年10月26日
条件:上記の期間中にデビューしており、データが取得できる全中央競馬競走馬
コース:芝・ダート

全45,263頭

競走能力の算出に利用しているデータ
勝敗データ
・着順
・単勝率
・複勝率
タイム系データ
・補正タイム
・着差
・上がり3Fタイム
その他
・獲得賞金
・出走レースレベル
・単勝オッズ
(上記の変数について、必要に応じて平均値の算出・標準化をしています)
これらを総合的に勘案し、適切な重み付けをして算出した値を競走能力としています。

3.競走馬能力ランキング:トップ50

さて、本題の競走馬能力のランキング・トップ50となります。競争能力は50を平均値とした偏差値で算出しています。補正タイムはTarget Frontierの補正タイム9を使っています。獲得賞金は本賞金のみ、海外レース除く。

画像1

(2021年10月26日現在)

堂々の1位は史上最多9冠で有終の美を飾ったまま引退した最強女王である「アーモンドアイ」となりました。競争能力も146と2位を大きく引き離しています。獲得賞金は海外レースも含めると19億1,526万円となり、こちらも歴代最高記録です。

2位は「サブちゃんの孝行息子:キタサンブラック」,スピードはアーモンドアイよりも速いようですが、出場レースのレベルが高く、勝率や複勝率で負けており2位となっております。

3位は、現役馬のグランアレグリア。補正タイムはデータ上最も速く、歴代最速のスピードを持つのではないでしょうか。馬名がかっこよく私の一番好きな馬ですね。

4位は「金色の暴君:オルフェーブル」です。ラストランの有馬記念で独走し、凱旋門賞も2着2回を記録しています。実力は最上位と言われながらも気性の荒さから大敗も多く、4位に落ち着いています。

同率4位は現役馬「クロノジェネシス」となっております。現役馬では獲得賞金1位であり、スピードではアーモンドアイに匹敵しますが、単勝率でグランアレグリアにやや劣るため順位を落としていますね。

その他の注目現役馬を見てみると、私達の「ソダシ」は24位と結構上位になっています。これからの活躍に期待です。また、3強対決の10月31日「天皇賞・秋」の「グランアレグリア(3位)」「コントレイル(8位)」「エフフォーリア(11位)」はやはり実力が拮抗しており、直接対決が楽しみですね。

皆さんの推し馬は50位内に入っていたでしょうか?記事をご覧いただきありがとうございました。

また、回収率アップに役立つデータ分析コラムも載せております。是非こちらもお読み頂けますと幸いです。

【競馬予想について】

【株式投資理論を応用した競馬予想】競馬予想のコンセプト

【データ分析コラム】

【古馬の壁】古馬混合戦における馬齢の影響はあるのか?

データ分析コラムや予想記事を作成しましたらtwitter上でも報告しております。よろしければ下記からフォローいただけると嬉しいです。

twitter

4.すべての競走馬の能力データについて

該当期間の全ての競走馬の能力データは膨大な量(約4,5000頭、PDFデータにして1,078ページ)になり、この指標データを自分の予想モデルに組み込んで今後の競馬予想を行っていこうと考えているので、大変恐縮ながら50位以降の全ての競走馬の能力データは有料とさせてください。

今後、対象期間の拡張や分析を加えてスピードやスタミナの指標を追加していく予定です。記事をご購入していただいた場合は、その後の更新は追加料金なしでご覧いただくことが可能です。また、更新時にはtwitterで告知もしくは、noteを通じて連絡が行くことと思います。

ご自身でデータが分析しやすいように、また、これからのレースの出走馬を比較・分析しやすいようにPDFおよびEXCELファイル形式でダウンロード出来るようにしておりますので、ご自身でお好きなようにご活用いただけますと幸いです。

データの追加および購入者数に応じて値段を上げていきますので、ご関心のある方は早めにご購入をご検討ください(上述の通り、早く買っても更新後の記事も追加料なしでご覧いただけます)。ご質問等は気軽にコメントください。

※有料エリアにはほとんど文字数はございませんが、データはPDFおよびExcelファイルで提供しておりますので、ご安心ください。

ここから先は

420字 / 6ファイル

¥ 300

期間限定 PayPay支払いすると抽選でお得に!

この記事が気に入ったらサポートをしてみませんか?