mozu

2021年桜花賞から競馬にハマる。 偶然にも初年度の回収率が100%を超えたので、本格…

mozu

2021年桜花賞から競馬にハマる。 偶然にも初年度の回収率が100%を超えたので、本格的に勝ちたいと思い勉強したことの備忘録。 当面は競馬AI作成を試みる。 推し馬はディープボンド

最近の記事

【競馬AIのお勉強】現状を知る

なぜか投稿で来てなかったので今更感ある文章なのをお許しください。当時の気持ちってことで 桜花賞が近づいてきましたね。今のところ本命はハーパーです。リバティアイランドは強いと思いますが一矢報いるとしたら彼女かと。 今回は、動画の27回を実装。 間違っていた単勝適正回収値の求め方を修正する回です。実際そのような買い方を現状していなかったので影響はあまりないのですが、この回で改めて回収値や的中率をみてみるところがあり自分のも改めて確認。 まず前提として元動画よりも過去のデー

    • 【競馬AIのお勉強】土日の振り返りと今週やること

      バタバタしつつも土日数レース分を作成中のAIを回しながら出来ました。 日曜はフルに近い形で参加できて、単勝20倍台前後の馬を2回抑えられて大阪杯も同じパターンでかけて12Rも参加してってやればプラスで終われたかもな結果に。 肝心の大阪杯はというと、何故か1番手指名がノースザワールドとまぁ確かに印象的な競馬をしてはいましたがなかなか大胆かつ、まだまだ調整の余地ありといった形でした。そのあとの評価はジャックドール、ジェラルディーナ、ヴェルトライゼンテ、スターズオンアース、ヒシイ

      • 【競馬AIのお勉強】ターゲットエンコーディングと競走馬の勝率について考える

        動画をみて実装するほうはターゲットエンコーディングの回まで実装完了。 ターゲットエンコーディング=カテゴリカル(質的)データを数値に変換する方法の1つだそうで。開催場所や芝ダートなどの区別に賞金などの数値を当てはめて数字上の意味を持たせた回になります。ターゲットエンコーディングをどういう形で行うかは結構頭を使う部分に感じたので今回やったことが有効かとか他にどういうことができるかのようなことは追々理解が追い付いたらやっていこうと思います。 続いて馬の勝率について 期待値は

        • 【競馬AIのお勉強】馬連回収率をだす&馬連の期待値をみてみる

          前回に引き続き動画に基づいて馬連ボックスを買った時の予測モデルを作成。 無事に実装できて(無事に〇〇できてというと川田ジョッキーの追切や勝利後コメントがよぎる)回収率をかけた枚数ごとにだすと、動画とは違い少ない枚数で100%越えがみられるもののだんだん80%程度に収束するというグラフに。差としては参考レース数。こちらは2019年から2023年の先々週のレースまでを入れてテストデータ訓練データにわけてやっているのに対し、動画は2019年から2020年の途中というところで、どち

        【競馬AIのお勉強】現状を知る

        • 【競馬AIのお勉強】土日の振り返りと今週やること

        • 【競馬AIのお勉強】ターゲットエンコーディングと競走馬の勝率について考える

        • 【競馬AIのお勉強】馬連回収率をだす&馬連の期待値をみてみる

          【競馬AIのお勉強】馬連回収率を算出するモデル作成と週末の競馬

          動画の方は馬連回収率を出す動画の前編分まで実装 土日の競馬は先日のスコアが出る状態から三着内率をだせるようにし三着内率とオッズを掛け合わせたものを暫定で期待値として100を超えたものを軸に単勝と三着内率上位2頭へのワイドを買うというやりかたで実践。 結果としてはまだしっかり計算はしていないけどまだマイナスではあるという感じで一日運用して+におさまればなーと思っている感じ。まぁもちろん試行回数にもよりますが気持ち的に ・運用して思ったこと たとえば高松宮記念のトップ予想が

          【競馬AIのお勉強】馬連回収率を算出するモデル作成と週末の競馬

          【競馬AIのお勉強】特徴量をさらに増やす

          今回は下記の動画にのっとって着差と通過順を特徴量に増やしました。 追加して回収率を見るもなかなか厳しいグラフに… 単勝ではかるならいまの三着以内率じゃなくて一着かそれ以外かで分けて分析がいいのかなーそもそも1着率2着率3着率を出すようにすればいろいろな馬券買うにあたって回収率をだせるのかな… そもそも3着内率だしてるならワイド中心にして回収率をみたほうがいいのかな…などあれこれ考えてみているところ。 とにもかくにも一旦は動画やりきって形にしなくてはという感じ。

          【競馬AIのお勉強】特徴量をさらに増やす

          【競馬AIのお勉強】Opentunaとclassmethod、staticmethod

          引き続き動画で勉強中。今回はこちら いままで手動で調整したLightGBMのパラメーターをよしなにやってくれるOpuntunaの導入。実際にやってみると先日の阪神大賞典予想順が変わり、ボルドグフーシュ、ジャスティンパレス、ブレークアップの順に3着内率が高いと予想し感動。 一方でOpentunaを使うタイミングも考えないとデータ追加するたびに都度最適化を行うのか、一度チューニングして回収率担保できるデータができたらそれ固定でいくのか。そこらへんどうしてるんでしょうね…そもそ

          【競馬AIのお勉強】Opentunaとclassmethod、staticmethod

          【競馬AIのお勉強】予測スコアを出せるようになったので実際に予想してみた

          プロフに書いているように推し馬はディープボンドなのですが、昨日の阪神大賞典は悲しい結果で落ち込んでます。あとから上がりの速度とか見てるといつも通りな感じではあるので、展開が向かなかったと思う他ないというか、もっと前につけたらつけたであがりが出たかはわからないので判断が難しいところ。 といいつつ、先週黙々と作業をしてAIは予測スコアを出して高い順に並べるところまで実装完了していて実際に阪大を予想してみると、 ボルドグフーシュ ジャスティンパレス アケルナルスター(!?) ブレ

          【競馬AIのお勉強】予測スコアを出せるようになったので実際に予想してみた

          【競馬AIのお勉強】出馬表に血統データをくっつける

          本日も競馬予想で始めるデータ分析・機械学習さんの動画で勉強 netkeibaの出馬表をスクレイピングして形を整えるとこまでが前回ですが、この出馬表血統データがまだありません。なのでくっつけようの回。 ただくっつけるにあたって現実装には問題があります。馬の血統データをこれまでのレースに紐図けて取得しているので初出走の馬はまだ血統データが登録されていないんです。 なので、今は血統データ存在しませんよというアラートを投げるよう処理を入れました。そこだけ改めてスクレイピングして

          【競馬AIのお勉強】出馬表に血統データをくっつける

          【競馬AIのお勉強】データ量の追加と出馬表スクレイピング

          引き続き競馬予想で始めるデータ分析・機械学習さんの動画で勉強。 今まで2019年のデータをあつかっていたのですがこのタイミングで2023年までのデータを追加。スクレイピングの時間がかかったこともありちょっと足踏みのターンでした。 動画後半では走る前の出馬表をスクレイピングする関数を作成。今までのデータをもとにこれの順位を予測すると考えると、だんだん実装が進んできているのを感じてテンションが上がってきます。

          【競馬AIのお勉強】データ量の追加と出馬表スクレイピング

          【競馬AIのお勉強】データのブラッシュアップと土日の競馬

          引き続き競馬予想で始めるデータ分析・機械学習さんの動画で勉強中 今まではその馬が3着以内に入るかどうかの確率をその馬単体で考えていたけど、レースなのでその確率を相対的なものにしましょうという回でした。 数学の要素が大きいので難しさはあるものの、たとえば重賞のように強い馬ばかりがあつまるレースだと3着以内に入るような強さを持つ馬がたくさんいるわけで、絶対評価だと大量に買える奴が現れてしまうということになってしまうという。でも実際は未勝利戦にG1クラスの馬が出たらそりゃ勝つけ

          【競馬AIのお勉強】データのブラッシュアップと土日の競馬

          【競馬AIのお勉強】特徴量を見直す

          本日も競馬予想で始めるデータ分析・機械学習さんの動画で勉強 おもっくそサムネのネタバレをすることになるんですが、予測に仕様する特徴量から単勝オッズと人気を削除する回です。 競馬は着順を当てるゲームではない、回収率をあげるゲームだなんてことをいう馬券師は多いイメージですがそれをやってみて実際に回収率が上がるっていうんだから面白いもので。 併行して先日購入したこちらも読書中 動画に沿っての実装でなかなか時間を取れないので練習問題は手を付けずさらっとまず1周読もうとしています

          【競馬AIのお勉強】特徴量を見直す

          【競馬AIのお勉強】血統データをダミー変数に変換

          本日も競馬予想で始めるデータ分析・機械学習さんの動画でお勉強。 前回スクレイピングした5代にわたる血統表の子たちをダミー変数にしてこれまでのデータにつなげちゃおうな回。 馬の名前でなく適当な数値に変換して分析しましょうねってやつです。このレベルではやらなくても2択のものを1と0で分けるみたいなことっていえばイメージ着きやすいかも。そして「AI競馬 人工知能は馬券を制することができるか?」で書かれていた特徴量はこんくらいでカラムは~みたいな説明されているのがこういうことかと

          【競馬AIのお勉強】血統データをダミー変数に変換

          【競馬AIのお勉強】血統データをスクレイピング+弥生賞振り返り

          本日も競馬予想で始めるデータ分析・機械学習さんの動画で勉強。 今回は2019年に出走した競争馬の血統をスクレイピング及び加工する回。 動画内だとカテゴリ変数にするタイミングとダミー変数にするタイミングが一度ぐちゃぐちゃになって混乱したものの特に大きな問題はなく。 1年で出走する馬が11000以上いるのでスクレイピング作業には時間がかかります。年数を増やしていく場合は継続出走する馬もたくさんいるので基本デビュー組を追加していく形になるのかなと思っています。 そして昨日の弥

          【競馬AIのお勉強】血統データをスクレイピング+弥生賞振り返り

          【競馬AIのお勉強】出馬表のスクレイピングに大苦戦

          昨日あまり時間取れずだったので、昨日今日かけて下記の動画部分に着手。 今回はSeleniumを使ったスクレイピングを行う回なのですが、それに大苦戦。 Gogledriverを使うときのパスがよくわからなかったり、Googledriver-binaryを使うとverがあっていなかったり動画の時とSeleniumの仕様が変わっていたりで大苦戦。と言いつつエラー調べたらヒントが転がっているのは毎回で先人達に感謝しながら進める感じ。 今日も外出だったので土曜競馬そんなに見れなか

          【競馬AIのお勉強】出馬表のスクレイピングに大苦戦

          【競馬AIのお勉強】回収率を計算する

          ユーバーレーベン引退の報にショックを受けつつ本日も競馬予想で始めるデータ分析・機械学習さんの動画でお勉強 この動画では馬ごとに3着以内に入るかそうでないかを1と0でわけて、3着以内に入ると判断した馬に100円ずつ複勝をかけたときの収支をだすということを実施。 また3着以内にどれだけ入るか判断する基準の閾値を設けて閾値ごとに収支をだしていきます。閾値をあげれば判定が厳しくなるのでだんだん購入を絞るということですね。 結果かけなければ回収率100%や!というグラフができ、も

          【競馬AIのお勉強】回収率を計算する