見出し画像

競馬AI予想との戦いは、あと5年が勝負(無料記事)

新馬・未勝利戦のメルマガを8年間発行している、マネードラゴン馬券塾です。11月からAI予想に切り替え、16万5500円の払戻を受け、回収率は119%と好スタートを切りました。

事前買い目登録制のレジまぐの審査を受けています

さて、AI予想が好調で社会現象になり、オッズの低下から予想好評を取りやめた「ゆま牧場」を例に挙げるまでもなく、今後の競馬は、AI予想と人力予想の戦い、AI同士の戦いとなってゆきそうです。

「ゆま牧場」は、どのような要素(AIでは特徴量と呼びます)を予想に活用しているのでしょうか? 詳細は非公表ですが、以下のような要素があるようです。

  • スピード指数

  • テンの時計

  • 上がりの時計

  • 過去4走

  • 斤量

  • 馬体重

  • 父、母父、父系

  • 開催前半の成績、後半の成績

  • 季節

  • 含水率、天候、馬場状態

  • 調教師・騎手の組み合わせ

AIでは、機械学習を使用する人が多く、上のデータをまずAIに食わせます。ついで期間を指定し、過去のレースを学習しつつ最適な比重を組み合わせ、ロジックが完成します。

ゆま牧場は、システムは非公表ですが、機械学習のなかのツリー構造を使用していることは、過去に明らかにしています(現在は異なる可能性あり)。これは「決定木」という仕組みの可能性があり、この仕組みは、各要素の効き方の比重が可視化しやすいことに特徴があります。

そのため、設計者の「ゆま」さんだけは、上のような各比重の効き方のグラフをアウトプットすることができます。

さて、機械学習は、過去の大量のデータ(ビッグデータ)を短時間で分析できることが最大のメリットです。

筆者は、2022年の9月まで、ターゲットフロンティアは使用していましたが、オリジナル要素を中心に、Excelによる人力のバックテスト(過去のレースにロジックを当てはめた結果を集計)を行っていました。1つのロジックの数年のバックテストでも、およそ100時間程度を要します。これをAI(データベース)で行うと、なんと30秒で済みます。

AIの設計者は、競馬歴は5年程度が多く、理系の研究者が多いため、一般的な競馬の経験値は、実は豊富ではありません。しかし、予想理論(ロジック)の検証時間が、1万倍ほど速いため、経験値豊富なファンでも手も足も出ないまま、交わされるのが実情です。

そんな機械学習にも欠点があり、「過学習」と呼ばれます。過学習とは、言葉のイメージとは逆で、データが少なすぎることを指します。例えば、東京や大阪で1年に10回「ひょう」が降った年を学習した天気予報のロジックは、今後の天気予報のなかに「ひょう」を多く含ませすぎるはずです。結果的に的中率が落ちます。

競馬のデータのなかで「ひょう」に当たるのは、突発的な大穴や独自の馬場、極端に強い馬などです。例えば、テイエムオペラオーがG1を連勝していた時期を学習したロジックは、和田竜二騎手をG1に圧倒的に強い騎手と認識する可能性があります。和田竜二騎手は、テイエムオペラオー以降、G1に多数出走していますが、ディープボンド、ロカしか勝ったことがなく、過学習により、的中率が落ちることになります。

しかし、アナログ予想は、機械学習とは比べものにならないくらいの、過学習のリスクがあります。例えばG1を過去10年から予想する方法は、データが極端に少なく、過学習のデパートと言えます(=的中率が低い)。

そもそも、ロジックを決めずに、その都度その都度予想を行う場合、直近の成功や失敗を参照する率が高いはずで、典型的な過学習です。それ以前に、自分が過去に予想したときの手順を記録している人も少なく、過学習以前の問題として、データベースに穴が開いている状態とも言えます。

データベースがバケツだとしたら、AIのバケツは決めた期間のレース結果やロジック成績がきっちり収まっており、何日たっても変わりません。手動予想の場合、そもそもバケツに穴が開いているほか、バケツの中身が、毎日変わるようなものです。過学習以前の問題として、学習対象がブレていますので、とくに回収率には限界があるはずです。

とはいえ、筆者も新馬・未勝利戦のメルマガでは、AI予想の場合でも、予算の10%は、アナログのレース観察をもとにした買い目に投じていますし、2022年に12クラを的中しているG1ではAIを使用していません。

競馬の面白さがアナログ予想ですし、アナログ予想を極めてからAIに進んだ方が、効率が良い部分もあります(どの要素=特徴量が効くのか、機械学習以前に当たりがついているから。機械学習も与える特徴量が悪いと、パフォーマンスが落ちます)。競馬の華がアナログ予想であり、予想を議論するのが競馬の醍醐味です。これは、将来も変わらないはずです。

とはいえ、現在は理系の大学院経験者レベルで収まっているAIも、今後は取り組む人が増え、中規模の企業が資金繰りに導入する可能性もあります。AIが普及すると、単複・馬連の的中時オッズは、1倍台が多くなり、ファンは3連単へ動いて行くはずで、今の競馬とは景色が一変します。

そのときがいつ来るかなのですが、あと5年は大丈夫だと思います。現在はAIは、高校の基礎数学、応用数学を理解していないと、トップクラスには行けず、主に理系の情報畑の大学生や院生の経験者が取り組んでいます。気軽に機械学習を使用できるソフトが広まるまでは、大丈夫です。

また、幸いAIの設計者は、AI予想が普及した後の絵図がよく見えており、総じて特徴量や手法について口を割らない傾向があります。

例えば5年前には稼げたと言われるWebメディアは、現在は過当競争で、旨味がなくなってきています。この原因は、関係者が手法をしゃべり過ぎたからと言われています。関係者には文系が多く、やや読みが甘いというか、お人好しな面があったようです。

競馬のAI予想は、Webメディアづくり(このnoteもWebメディアで、誰でも書けます)に比べ、技術的に難しく、関係者の口が堅いことから、1年や2年では普及しつくさないはずです。しかし、技術の進歩はとにかく想像を超える速さであり、10年持つことはないでしょう。5年が勝負です。

そして、この5年間(2023~2027年)にやるべきことは次の通りです。

  • 段階1 徹底的に競馬新聞を読み込み、競馬記者の視点を全て盗む。数多くの予想をし、レースVTRをよく見る。

  • 段階2 ジャンルを絞り、引き続き予想やレース観察を続けながら、ターゲットフロンティアに慣れる。競馬書籍を読み込む。

  • 段階3 ロジックを自作し、過去のレースでテストし、Excel等に書き込んでゆく。この過程で統計の本質を体で覚える。

  • 段階4 ターゲットフロンティアより上のクラスの有料データベースを購入し、AI予想(機械による推論・探索)に踏み込む。

  • 段階5 この頃には機械学習をかんたんに実践できるソフトができている可能性が高い。必要に応じて機械学習(決定木、ランダムフォレスト、勾配ブースティングなど)を採用。

これが、情報系の大学院を出ていなくても勝てる道です。

筆者の新馬・未勝利戦のメルマガは、11月からAI予想に切り替え、16万5500円の払戻を受け、月の回収率は119%と好スタートを切りました。1クラで1000%越えの回収率を上げたクラもあります。

AI予想の裏話や、アナログ予想に役立つ、VTRの見方の話も取り入れていますので、頭の片隅にでも置いておいて頂けると、ありがたいです。
AI×未勝利 マネードラゴン馬券塾

この記事が気に入ったらサポートをしてみませんか?