見出し画像

AIで馬体診断してみた(結果編)

表題の通り、AIで競走馬の馬体診断をしてみた話をする。もう少し詳しく言うと、ディープラーニングによる画像分類で1歳馬の立ち姿写真から競走馬として活躍できるかどうかを判定できるものなのか試してみたというもの。最初の記事が結果編というのもおかしな話だが、半信半疑のままにやってみた結果を集計してみたら、思いのほか良い結果が出て驚いたというのがこのタイミングで文章にまとめてみようと思った動機である。
上の写真は社台SSで一般公開されていたディープインパクト(2014/10/10撮影)。

始めたきっかけ

始めたきっかけは、2019年の暮れのこと。正月休みを前に、勤務先の社内SNSで若手社員が「休み期間を利用してAIを勉強してみてはいかがでしょうか」と、参考となるリンク先などと共に紹介していたのを見て、ちょっと興味があったAIについて勉強してみようかと思い立ったのが始まりだった。そして、当時ノルマンディーOCに入会して一口馬主になったばかりの身であり、1歳馬の善し悪しがまるで判断できずに困っていたことから、「出資馬の選定にAIを活用できないか?」という考えに至った。その結果行きついたのがディープラーニングによる画像分類を利用して馬体の診断をするというもの。もちろんこの技術を利用すれば必ず良い結果が得られるという確信などはなく、果たしてAIで走る馬を見分けることなどできるのか、できるとすればどの程度まで正しく判定できるのかという好奇心から始めたものである。
なお、AIに関して全くの素人というだけでなく、Pythonにも触れたことすらないというレベルから始めたが、現在も素人の域は脱していない。そのため、AIの技術的なことはここではほとんど書かない(書けない)ので、ガチ勢の参考になるような記事にはならないだろうことは先にお断りさせていただく。

やったこととその結果

上述の通り、画像分類のAIモデルを作成するコードも自力で書けない程度には素人である。そのため、学習に使用していたUdemyという動画学習サイトにあったリンク先の動画を視聴し、コードをほぼ写経した。なお、このUdemyというサイトは頻繁にセールをやっており、その時の価格が普段より1桁安いぐらいの超特価なので「定価とは...?」という気分にさせてくれる。

走る馬と走らない馬の2種類に分類するAIを作成することに決め、1歳馬の立ち姿写真を可能な限り集めた。下で紹介する現在の3歳馬を評価したモデルを作成した時には、それぞれ966の写真を使用している。AIの技術的なことは書かないと言ったが、走る/走らない馬の基準をどう決めたか、どこから写真を集めたかなどは少しは書いておくべきと思うので、別の記事にそれらをまとめる予定でいる。

現3歳馬のうち、一口クラブ馬など約600頭の馬体診断を昨年のデビュー前に行った。その診断スコアによる分類と、2021/5/2までの勝利数および獲得総賞金による成績(比率)をまとめたのが以下の2つの表である。スコアは最高が1.00で最低が0.00となっている。(勝利数は、正確には収得賞金による1勝クラス以上、2勝クラス以上...という分け方。1勝馬でも重賞2着による賞金加算で3勝クラス扱いにしたりする。)賞金による集計では、一部の高額賞金獲得馬によって平均値がかさ上げされてしまうことも考えて中央値も見てみた。また合計頭数が勝利数と賞金の集計表で異なるのは、最初から地方所属となる馬を賞金の集計だけに加えたためである。未出走のまま既に抹消された馬もいるが、そのまま母数に加えている。

画像13

画像13

これらの表から、明らかに走る馬と走らない馬をAIの画像分類で判定できると言っていいと思われる。どの勝利数クラスでもスコアが上がるにつれて率が一律に上がるとは言い切れないが、3勝クラス以上になる確率が5%を超えるのはスコア0.07以上だけだったり、スコア0.10未満では3勝クラス以上が出てこなかったりと、ほぼ相関はあると見てよいだろう。また賞金額による集計でも、平均値、中間値ともにスコアが上がるほど大きいという傾向が見て取れる。AIで馬体診断が可能か否かという問いに対しては、可能であると考えて良さそうだ。

次に、どの程度まで精度よく診断できるのかということも確認してみたい。
クラブ馬募集時の馬体を写真や動画で診断してネット上で公開しているものはいくつか目にするが、その結果を上の表のように集計したものは見当たらない。そのため、1歳馬の診断ではないが、昨年の「POGの達人」(いわゆる赤本)に巻末リストの予想印はどの程度機能しているか?という特集があったので、その集計結果と比較することにしたい。特集記事によると、赤本の巻末リストには「須田」「浅野」「本誌」の3人の予想印があり、それぞれの結果が以下の通り。勝ち馬率、賞金はいずれも2歳新馬戦開始から日本ダービーの週までのものとのこと。

この結果と比較すると、さすがに精度の良い須田鷹雄氏や本誌の予想印には劣るものの、AI診断も十分に健闘しているように見える。
個別に見ると、AIの集計とは選定馬の数(率)は異なるが、須田氏、本誌の最高評価の◎の勝ち馬率の70%, 65%はかなりのもので、無印と比べて勝ち馬率が2倍以上、賞金が4倍弱となっている。AIの集計では、スコア1.00(または0.90~1.00)と0.00(または0.00~0.10)を比較すると、勝ち馬率は2倍弱、賞金は3倍にも届かない。しかし、「日高びいき」「穴狙い」という酌量の余地はあるものの浅野靖典氏の予想印はAIとほぼ同等の結果と言える。
血統、育成スタッフの評価、1歳夏から2歳春までの成長、歩様の確認など、今回のAI診断に比べて多くの重要な情報を加味したPOG本の予想にここまで迫れるのであれば、十分に評価に値すると言ってもいいのではないだろうか。
ちなみに、noteの文章に表をきれいに書くのはできないの?と思ったので、いろいろ調べてこの記事を参考にさせていただいた。

この後、じゃあ実際に馬選びにどのくらい役立つのかなど自分なりの考察を書こうとしたが、ちょっと長くなったので別記事に分けることにする。

2018年産駒の評価結果

昨年実施した評価結果を紹介する。対象は一口クラブの募集馬とセリ高額落札馬とした。一口クラブの選定基準は明確なものはないが、重賞で活躍馬を排出するクラブを中心に主観で選んだ。選びたかったけど募集時写真が当歳馬と思われるために除外した例もある。
本当は診断した全頭の結果を出したいところだが、「自分の愛馬をこんな不当に低評価するとは何事か!」と不快に思われる懸念もあるので、スコア0.70以上の高評価馬のみを紹介することにした。実際、自分の出資馬のAI評価があまりにも低くて不満を持ったこともあり、全頭公開は自重する。

ノルマンディーOC
なぜこのクラブが最初かというと、自分が出資しているからという理由である。
平均スコアが0.27で、選ばれたのは50頭中4頭のみと非常に寂しい。自分の出資馬であるスノークォーツとフェイダウェイも掲載基準の0.70には遠く及ばない評価。ただ、以下の高評価馬4頭がいずれも未勝利だったり、勝ち上がり馬のAI評価が高くなかったりして、今回作成したAIモデルはこのクラブで勝ち上がる馬を見分ける精度が良くないのでは?という疑惑もある。本来やりたかったのがここの募集馬の評価だったので、やや不満の残る結果となっている。

画像3

ワラウカド
なぜこのクラブが2番目かというと、これも自分が出資しているから。
この世代7頭と小規模ながら6頭がスコア0.70以上で、満点も3頭、平均スコア0.82という非常に高い数値を出したが、実際の結果が伴っていないのが残念。みんなもっとできる子だとAIが言っているのでがんばれ。
自分の出資馬レナーナは0.73というまあまあの評価をされており、まずは勝ち上がりを期待している。

画像11

サンデーTC
以降はnetkeiba.comの一口馬主ページの順番に従って紹介する。
サンデーは82頭中32頭が選ばれ、平均スコア0.61、満点評価も6頭と、さすがの内容。朝日杯勝ち馬グレナディアガーズも0.90と高評価できている。

画像5

シルクHC
81頭中41頭が選ばれた。平均スコア0.63、満点評価9頭と、わずかの差ながら今回集計したクラブの中では(頭数が少ないワラウカドとDMMバヌーシーを除き)最高の成績を出す。重賞勝ち馬の2頭、クールキャットとピクシーナイトはそれぞれ0.85, 0.95と高評価できている。

画像8

キャロットC
86頭中44頭が選ばれ、平均スコア0.62、満点評価5頭という好内容。無敗の皐月賞馬エフフォーリアを満点評価したのが目を見張る結果。一方で、昨年のPOGでも大きく注目されAI評価も満点だったアークライトとセブンサミットが現時点で未勝利なのは非常に興味深い。

画像4

社台TC
84頭中22頭と選ばれた頭数も少なく、平均スコアも0.43とちょっと低め。重賞勝ち馬エリザベスタワーは高評価とならずリストに上げられなかった。

画像6

G1TC
58頭中20頭が選ばれた。平均スコア0.48で満点評価は1頭。重賞勝ち馬ヴィクティファルスは0.84となかなかの評価ができている。

画像7

東京TC
選ばれたのは37頭中7頭で、平均スコア0.43。重賞勝ち馬レッドベルオーブは満点評価できている。

画像9

ロードTO
選ばれたのは32頭中9頭で、平均スコア0.52。クラブからはまだオープン馬も出ていないので判断は難しい。

画像10

DMMバヌーシー
13頭中9頭が選ばれ、平均スコア0.76、満点評価も4頭いるというかなり高い評価となっている。重賞勝ち馬はいないが、オープン馬がタイムトゥヘヴンとディープモンスターの2頭いて、それぞれスコア1.00と0.84で高評価できている。

画像13

セレクトセール1歳
2019年のセレクトセール1歳上場馬のうち、4000万円以上の価格で落札された馬を対象とした。対象99頭のうち63頭も選ばれ、満点評価が22頭、平均スコア0.70と全体的に非常に高い評価となっている。重賞勝ち馬のグラティアスは満点評価だったが、ラーゴムはAIの評価が低くここに選ばれなかった。

画像12

今後の予定

・書ききれなかった内容を記事にする。考察編と実践編の2つにまとめる予定。
・今年の2歳馬のAI診断結果を紹介する。今年は対象を拡大し、ほぼ全ての一口クラブ馬を評価している。
・これから募集される一口クラブ1歳馬のAI診断結果を紹介する。
・18年産駒の成績を引退するまで見守り、集計を更新する。
・新たな写真を追加してAIモデルを更新し続け、来年度以降も精度を向上させる。

(追記)
関連記事:
AIで馬体診断してみた(考察編)
AIで馬体診断してみた(実践編)



この記事が気に入ったらサポートをしてみませんか?