見出し画像

競艇予想AI ジンベイについて

初めまして,競艇予想AI ジンベイの開発者です!
いつも競艇予想AI ジンベイの予想を参考にして頂きありがとうございます!
本記事では,競艇予想AI ジンベイについて簡単に解説します.

初めに

競艇予想AI ジンベイを作り始めて,今日で約1年が経ちました.
最初は,ヒソヒソと作っていましたが,競艇×AIの面白さを広げたいとの思いから,検証結果やAI予想を公開することにしました.

競艇予想AI ジンベイ

突然ですが,皆さんは,何に基づいて舟券を買っていますか?
全国勝率,階級,オッズ,直前情報...など 人によって様々な判断基準があって,それを総合的に加味して決めていると思います.
でも出走表一つ見ても,あまりに情報量が多くないでしょうか.私自身,競艇素人の時,結局どれ見ればいいの?と思った記憶があります.

出走表

出走表の他にも数えきれないくらいの指標があります.
それら全ての指標を総合的に加味して,買い目を決めてくれるマシンがあったら嬉しいですよね.それが競艇予想AI ジンベイです.


どんな指標を使ってる?


AIに覚えさせる指標を"特徴量"と呼びますが,どんな特徴量を使ってAIモデルを構築しているのか,特に気になる部分ですよね.
結論から言うと,
1.出走表・直前情報に出ている指標ほぼ全て
2.自作の指標
の計 81 個の指標を特徴量に使っています.

1.出走表・直前情報に出ている指標ほぼ全て

先ほど,全ての指標を総合的に加味すると言いましたが,ちょっと言い過ぎな部分があって,使ってない指標もあります.

使ってない指標は以下の指標です.

  • ボートの2連対率・3連対率

  • 支部

  • 体重

これらの指標は,予想するときに普通あまり重要視しないですよね.これはAIにおいても同じで,使うと性能が落ちます.逆に上記の指標以外は全て使っています.

2.自作の指標
もちろん,上述の指標だけでもAIモデルはある程度の性能を発揮しますが,それでは限界があります.
そこで,我々で独自に指標を作ってあげる必要があります.そしてここがAIモデルの構築で大事な部分です.

体感的に良い指標だと考えているのが,コース別の1着率~3着率です.「それ,ボートレースの公式サイトにあるじゃん」ってツッコミが聞こえてきますが,その通りで.公式サイトで選手毎のコース別成績が公開されています.

でも実はこれ,めっちゃ大事な指標にも関わらず,半期毎にしか更新されません.タイミングが悪いと半年前のデータだったなんてこともあり得ます.要は直近の結果が反映されてないんですよね
なので,私たちはデータを自前で用意し,出走時点までのレースデータからコース別3連対率を計算しています,

他にも自作の指標がいくつかありますが,かなり複雑で説明が大変なので,また別の機会にでも記事にしたいと考えています.

AIモデル(AIに詳しい人向け?)

結論から申し上げると,AI(機械学習)モデルには決定木ベースのアルゴリズムを用いています.
決定木ベースのアルゴリズムについて詳しく知りたい方はこちらの記事がわかりやすいです.

決定木ベースのアルゴリズムを使っている理由はズバリ,性能が高いからです.あと,モデルがどの特徴量を重視しているのかがわかる点も大きいです(この部分についても別の記事で公開予定です).
機械学習モデルを色々と試し,決定木ベースのモデル(RF,XGboost,LightGBM…etc)の性能が高いことがわかってきました.
もちろん,これまで様々なAIモデルを試しています.

さらなる性能アップの案もいくつかあり,以下に一例を示します.

  • 不均衡データに対する対策

  • ハイパーパラメータの最適化

今後も良い結果が得られた際には情報をどんどん公開していきますので,是非フォローよろしくお願いします!

なお,2月中にwebサイトをオープンする予定です!
サイトオープンしました!→
https://jinbei-boatrace.com/
サイトでは,競艇予想AI ジンベイ の3連単予測に加えて2連単予測も公開します.さらに独自のデータで計算した3連対率や,オリジナル指標なども公開予定です!
続報をお楽しみに!!!!



この記事が気に入ったらサポートをしてみませんか?