見出し画像

競馬予想は、得意ジャンルの重回帰分析で簡単に勝てる!

お知らせ
新たに無料記事を公開しました!
8月の競馬予想が全勝!秋競馬に向け予想ロジック構築の流れを公開

>>>ここから本文(今回、本文の改訂はありません)<<<

マネードラゴン馬券塾です。未勝利・新馬戦に特化したメルマガを8年間発行している、競馬オタクです。

今日は、競馬の勝ち方、勝ち筋について説明したいと思います。

時代は、単回帰分析から重回帰分析へ!

単回帰分析という言葉があります。

単回帰分析の「回帰」は、自分のしたことは回り回って帰ってくる、というイメージから分かるように、因果関係という意味です。「単」は単勝でおなじみの1つという意味。

単回帰分析は、何かを1つの要素から予測する方法です。

競馬もかつては、単回帰分析の時代がありました。歴史的に有名なのは、スピード指数。スピード指数が出回り始めた頃は、スピード指数だけで穴が見事に的中し、年間で勝つことも容易だったと言われます。

もう1つは、オッズ解析(異常投票分析)。陣営が勝負をかけた馬を、投票の集中度などから見抜く方法ですが、こちらも出始めの頃は、オッズ解析だけで勝てました。

しかし、スピード指数は、競馬新聞社がデータベースを入れ、ある時期から、予想記者も閲覧できる状態になりました。すると、すぐにオッズに反映し、儲からなくなりました。オッズ解析(異常投票分析)も、競馬場やWINSでオッズを紙で買っていた時代には、かんたんに勝てましたが、インターネットが普及し、関係者側も投票時間をずらすなどし、やや廃れてきています。

現在、1つの要素だけで、馬券を的中できることはありません。正確に言えば、1つの要素だけで購入した馬券で、中長期のプラス決算は難しくなっています。

そこで注目されるのが、重回帰分析です。「回帰」は因果関係という意味。「重」は、1重に、2重にというニュアンスから、複数という意味です。重回帰分析は、何かを複数の要素から予測する方法です。

例えば、明日の天気を村の長老の表情から予測するのは単回帰分析ですが、気温や湿度、気圧、風の向きや強さから分析するのは、重回帰分析です。

重回帰分析の具体的な手順

重回帰分析の手順としては、まず対象のカテゴリを決めます。

短距離、マイル、中距離、あるいは、未勝利戦、重賞などが、分かりやすい例です。このほかでも、JRAは、中央コース(東京、中山、阪神、京都)とほかのコースでは、勝つ馬が大きく入れ替わるように設計しています。

JRA全競馬場 直線の長さと急坂ランキング

そのため、ご自身の興味や得意を基準として、まずは分析するカテゴリを決めることになります。あとは、カテゴリ内のレースをしばらく見学(競馬新聞による通常の予想でOK)し、結果に影響しそうな要素について、仮説を立てます。


・スピード指数
・騎手
・厩舎
・先行力
・調教状態

仮説を立てたら、過去のレースでテスト(バックテストと呼ばれる)をくり返し、それぞれの比重を定めてゆきます。


・スピード指数 30%
・騎手 30%
・厩舎 20%
・先行力 10%
・調教状態 10%

完成した仮説(ロジック)に基づき、もう1度バックテストを行い、数年単位で勝てれば、ロジックが成立したと言えます。これが、重回帰分析の考え方です。

重回帰分析は、一般にはソフトやプログラムによって自動計算するものですが、エクセルによる手作業でもできないことはないです。

ただ、1つ条件があり、競馬データベース(代表例がターゲットフロンティア)の導入は必須です。ロジックが用いる要素のなかで、最低でも半分は、データベースで高速分析可能な要素にしておかないと、試行錯誤しているうちに1年経ってしまいます。極端な話、人間の寿命の範囲内で、まともなロジックが成り立つ可能性は、ゼロに等しくなります。

とはいえ、全てをターゲットフロンティアなどのデータベースに頼ると、誰かと同じロジックとなり、勝ち筋は見えてきません。いいかえれば、ターゲットフロンティアがピックアップしている要素は、回収率が100%を超えた時点で見つかって荒らされ、直近では80%前後に収まっているはずです。

データベースとオリジナル要素をうまくミックスします。ターゲットフロンティアなどのデータベースさえあれば、手動でも、重回帰分析は不可能ではありません。

お盆期間中は、時間がある方も多いはずですので、ロジックを立てて、分析してみるのもおすすめです。

例えば、下のようにエクセルにまとめてゆきます。

時計(スピード指数)は、外部のデータベースの数値を購入、騎手・厩舎はターゲットフロンティアで、過去5年分を集計しています。くり返すようですが、要素の半分程度は、数千件から数万件レベルでの分析を伴うデータや、データベースで高速分析ができるデータを使います。

これらは、住宅でいえば、コンクリートの基礎や柱にあたるものです。この部分は正確に作ってゆかないと、家は建ちません。一方で、基礎や柱だけでは、ほかと全く同じ住宅となり、競馬の神様は降りてきてくれません。壁や屋根のデザインは、手作業でオリジナル性を高めるイメージです。

例えば、上のロジックでは、走りについてはレースVTRを見て手動で評価しています。このように、ロジックには全体の何割かの部分で、オリジナル、かつ着順に間違いなく影響している要素が必要です。

「手垢がついていても良いので、とにかく統計分母が大きな再現性があるデータ」+「手作業でも良いので、手垢がついていないオリジナルなデータ」の組み合わせが、重回帰分析による、年間回収率が100%を超えうるロジック作りのコツです。

(ヒント)重回帰分析を自動化したのが機械学習です。機械学習は、作り手の競馬観(何を要素として演算させるのか)にも左右されますが、そこも自動化するのがディープラーニングです。AIのなかに機械学習があり、機械学習のなかにディープラーニングがあるという構図となります。

現在、夏競馬が進行中ですが、筆者作成の夏競馬用のロジックは、好成績を上げています。

未勝利・新馬戦に特化したメルマガでは、ロジック作成の裏話を交え、ご自身で予想したり、ロジックを作成したりするときに役立つ情報を提供していますので、ぜひご検討ください。

9月第1週まで現在のロジックを使用します。

マネードラゴン馬券塾(メルマガ)

この記事が気に入ったらサポートをしてみませんか?