ディープラーニングを使った競走馬の馬体評価
ディープラーニング(CNN)を使って馬の評価に使ってみたいなという話。まだ自分に実装力がないのでやりたいことのサマリだけ。
1.キーワード
ディープラーニング(CNN)…ここ数年で画像認識のデファクトスタンダーになっている技術。
パドック…次のレース出走する馬を小さな広場で歩かせるところ。馬券購入者はここで馬の調子を確認する。
一口馬主/共有馬主/POG…一般に馬主はお金持ちしかなれない。これを証券化することで一口持てるようにしたのが一口馬主、数人で共同所有するのが共有馬主、机上で馬主気分を味わうのがPOG(ペーパーオーナーゲーム)。血統や写真をみてどの馬を買うか決めることが多い。
2.背景・目的
その①パドックで活用したい
競馬においてパドックでの様子は重要な予想ファクターとされる。一方で、プロの騎手でも「パドックで見ただけでわかるわけない」という話もある。自分の感覚ではレベルの高いレースはどの馬もいい馬で仕上げもバッチリなので差はないが、レベルの低いレースならパドックでわかることもあるんじゃないかと思ってる。
→ これを検証したい&使えるものなら活用したい
その②一口馬主/共有馬主/POGの馬選びで活用したい
馬券を買うだけでなく、趣味で馬に投資(共有馬主)もしている。「社台オーナーズ」というところの会員になっていて、そこから送られてくるパンフレットの写真を見るのだけど馬の良し悪しなんかよくわからない。ググると馬体の評価方法なんかも出てくるので本当にわかる人が見ればわかるのかもしれない。
→ これを検証したい&使えるものなら活用したい
3.方法
①画像データ集め
パドック診断は動画で評価するのが一番いいのかもしれないが、動画認識はまだ技術として未発達の認識。動画は時間軸があるのでRNNと組み合わせたようなモデルが必要なのだと思ってます。なので画像認識用の静止画を集めが必要。で、パドックの静止画なんてどこにも落ちてないので、動画から抽出しないといけない。大体、こんな手順でしょうか。
1)TVを録画してパドックの動画データとして取得する
2)できるだけ同じ角度で写ってる場面を抽出する
→ この作業自体にCNN使った画像認識が必要
・事前に与えた写真と同じ角度で写ってるかどうかを判別する
・どの馬の写真かわかるようにゼッケンの数字を判別する
3)馬以外の背景を消す。できればゼッケンの数字も消す
・背景を消すのは世間にツールがあるのでこれを活用する
・ゼッケンの数字を認識するCNNから感応度の高いピクセルを
潰せばゼッケンは消えるはず
パンフレット診断はWEBから見れるのでクローリングするか、社台オーナーズにお願いすれば頂けるかもしれない。この場合も、馬以外の背景は消した方がいい。馬体と関係ないことろ、どの牧場で育ったかとか、が評価されてしまうかもしれないので。
②教師信号のモデル化
パドック診断は上級クラスのレースでそこそこ走った馬(賞金がでる8着以内)とそれ以外の2値判別。(ゼッケン関係ない気がしてきた)
パンフレット診断は稼いだ賞金額を教師信号にする回帰モデルでもいいのだけど、うまくいく気がしない。→上位N%以内に入るかどうかとして、Nをいろいろ変えてやってみればいいですね。
4.まとめ(何もまとまってませんが)
何もまとまってませんが、まずやるならパンフレット診断でしょうかね。パドックは個人的に静止画抽出のハードルが高いので。
この記事が気に入ったらサポートをしてみませんか?