見出し画像

【馬券データ分析】「前走の脚質」を深掘りするパート1

こんにちは。キラリです。

今回は、「前走の脚質」について回収率の観点で深掘りしていきたいと思います。

なお「脚質」というテーマは扱いが難しく、一気に深掘りしすぎると長文になってしまうためパート1としました。その理由も後ほど説明します。


結論

まず、この記事での私の結論はこちらになります

ペースなど他の条件を考慮しない場合、芝レースでは前走先行だった馬の回収率が最も高く、ダートレースでは前走の脚質によって回収率が変化するような傾向は見られない。

前提

「脚質」を扱いづらい理由

まずは「脚質」というテーマを扱いづらい理由から説明します。

理由は大きく分けて2つあります。

【理由1】
脚質には世界共通の定義というものはなく、情報の提供元によって定義が異なる

そのため、まずはこの記事内で脚質をどのように定義しているかを説明していくのですが、見ている情報元によっては必ずしも同じ分類にならない可能性があります。

【理由2】
「道中のポジション」のことを言っているのか「決め手」のことを言っているのかで呼び方が異なる

「道中のポジション」だけを分類する場合は

逃げ/先行/中団/後方/マクリ

の5種類に分かれるケースが多いのですが、「決め手」まで見て分類する場合は

逃げ/先行/中団/差し/後方/追込/マクリ

という7種類に分類されます。

例えば「差し」というのは、道中は「中団」に位置していた馬がレース終盤に加速して上位入線した場合に、「差し」という決め手(ワザ)を使ったものと判定され、差し馬に分類されます。

これは、実際にこの記事内での脚質の定義を見ていただいたほうが話が早いと思います。

脚質の定義

この記事内では、おおむね以下のように脚質(決め手)が判定されていると考えていただければと思います。

ややこしい話で申し訳ありません。ただ、「脚質」というファクターを予想に組み込む場合は「道中のポジション」だけでなく、見れる方は「決め手」まで見ていただいたほうがより正確に競走馬を評価できると思います。

今回の記事では「決め手」まで考慮した7種類の脚質を使って分析していきます。


分析の観点

次に、何かしらの仮説を立てることで分析の観点を明確にしていきます。

そうしないと「データをどのように分割またはグルーピングして分析を進めていくのか」という方向性や「結果の評価基準」が分からなくなるためです。

今回はパート1なので、ペースなどの条件は考慮せず、以下のシンプルな仮説が正しいかを確認していきます。

【仮説】
道中を中団や後方ポジションで進んだ馬は、最終直線で他馬にブロックされて抜け出せない可能性が高まるため、逃げ/先行馬より不利である。
特にダート戦では、中団以降にいる馬は前方にいる馬の蹴り上げた砂をかぶってしまうためさらに不利になる。

これを「競走馬は前走と今走で同じような脚質をつかうであろう」という前提のもと回収率の観点でどのくらい差が出るのか見ていきたいと思います。


傾向分析

分析対象データ

今回使うデータは、2018年以降の中央競馬で障害レースと新馬戦を除いた全レースを対象に分析をおこなっていきます。(約6年分)

(前走が「出走取消」「競走除外」「競走中止」となっているデータや、新馬戦以外でも、それがデビュー戦となっているデータは前走の脚質が存在しないため除外しています。)

約6年分のデータ確認

下の表は、上記の約6年分のデータを芝とダートに分けて前走脚質ごとに単複回収率を集計したものです。

2023/11/24 時点

ここですぐに気になるのが、「マクリ」のデータ数が他と比べて非常に少ないことです。(赤枠)

このような状態ですと、脚質によって集計結果の数字の信頼度にバラツキが出るため好ましくありません。

私はこのような場合は、一旦「マクリ」を無視して考えるか、もしくは最も脚質が似ている「追込」と同じグループに含めて分析を進めます。

今回は「追込」と同じグループに含めて集計しなおします。


ダートの結果確認

まずはダートの結果から確認していきます。

私はこのようなデータを何年も見続けているのですが、上のような結果が出た場合は、前走脚質によって回収率が変化するような傾向は全く出てないと判断します。

単勝回収率と複勝回収率の傾向に一貫性が見られないですし、そこまで突出した数字があるようにも思えないためです。

強いて言うとしたら、私は単勝回収率よりも複勝回収率のほうを優先するため、若干「差し」の回収率が高いようにも見えるのですが、「なぜダートで前走差しだった馬の回収率が高いのか」という理由が論理的に説明できないため、その判断も採用しません。

無理に傾向を見つけようとすると、「自分の都合のいいように抽出条件を決めすぎてしまう」というデータ分析の落とし穴にはまってしまうため注意が必要です。

つまり、上で立てた「ダートは中団以降の馬が不利」という仮説に対しては、「確かに不利なのかもしれないが、それはすでに多くの人が知っており、オッズに優位性が反映されてしまっているため、前走脚質だけで評価しても回収率の改善につながらない」と結論づけて、ダートの分析はこれで終了です。


芝の結果確認

次に芝の結果を見ていきます。

上の表を見ますと、前走「先行」の馬が単勝回収率でも複勝回収率でも最も高く、「後方」の馬が最も回収率が低い結果となっており、それ以外の脚質の馬はおおむね同じくらいの回収率になっていると解釈できます。

上で立てた「仮説」と比較すると、先行馬の回収率が高いのは想定通りで、逃げ馬の回収率が想定より低くなっています。

ただしこの理由としては、逃げ馬というのは頭数が少なく目立つため、前走逃げた馬は、スローペース展開を予想する競馬ファンから極端に人気を集めやすいからだと考えられます。

また、前走「後方」だった馬の回収率が低い理由としては、「後方」に分類される馬というのは、スタートからゴールまでずっと最後方を追走してきた馬で、「ペースについていくだけで精いっぱいだった弱い馬」だからだと考えられます。

このように仮説と異なる結果が出ても、仮説が間違っていた理由が論理的に説明できる場合は、ある程度信頼できる結果が出ていると判断できます。

逆に言いますと、「出てきた数字が絶対的に正しいと信じ過ぎない」こともとても重要で、そのために事前に仮説を立てておく必要があると考えています。


さらにグルーピングを進めて再集計

上記の結果をさらに、「先行」「先行/後方以外」「後方」の3つのグループに分割しなおして再集計した結果が下の表です。

今のところ、芝レースの場合は前走「先行」だった馬の回収率が最も高く、「後方」だった馬の回収率が最も低いと言ってよさそうです。


5年分の年別集計結果の確認

次に、同じ条件で年別に回収率を集計することで、上記の傾向の信頼度をさらに確認していきます。

結果を確認しますと、「2020年と2022年の単勝回収率」と「2023年の複勝回収率」の傾向だけ美しくありません。(赤枠)

ただし私はこの程度のブレであれば一時的な下振れだと考えて、長期的に信頼できる傾向であると判断してよいと思いますし

もっと結果を安定させたい場合は、「先行」と「先行以外」の2種類にグルーピングしなおして再集計を行います。

するとこのようにキレイな傾向が長期的に安定して現れるため、芝レースで前走「先行」脚質だった馬の回収率が高いという傾向は、かなり信頼度の高い傾向であると判断できます。

もともとこの記事で行いたかった「前走脚質」の分析結果としては『芝レースの場合は前走先行だった馬の回収率が最も高い』という結論となります。

競馬予想への適用

この結果は、競馬予想をする際に競走馬を評価する条件としてそのまま適用できます。

「芝レースの場合は前走先行だった馬を高く評価する」ことで、毎年安定して数%程度の回収率を改善することができます。

このような条件を数多く積み重ねることで、最終的にはより高い回収率の買い目を抽出できます。

最期に

今回は私が普段どのように競走馬の評価条件を作成しているかを説明するような内容になりました。

だいたいこのような思考の流れで、回収率を高められそうな条件をまず見つけて、見つけたとしても安易に採用せず、複数の角度からその条件の信頼性を確認してから採用するようにしています。

以上となります。
読んでいただいた方ありがとうございました。

******************
記事の全体図はこちら
******************

この記事が気に入ったらサポートをしてみませんか?