うまGPT

Chat GPTを使って競馬の予測を行います。もちろん予測はしてくれないので色々な角度…

うまGPT

Chat GPTを使って競馬の予測を行います。もちろん予測はしてくれないので色々な角度からプロンプトを作成して予測精度を高めます。ついでに統計学や機械学習も学んで欲張っていきます。

最近の記事

2月18日フェブラリーSの結果

予測馬連:5-8, 8-5 ワイド:5-15, 5-12, 8-15, 8-12 3連単:5-8-15, 5-8-12, 8-5-15, 8-5-12 結果馬連:7 - 9 ワイド:7 - 9, 8 - 9, 7 - 8 3連単:9 → 7 → 8 反省3連単が1,530,500円でしたね。このようなレースを是非とも当てたいですね。流石に3連単は難しいとしてもワイドか三連複を狙いたいところです。 前半3Fが33.9秒という速いレース展開で軒並み先行した人気馬が総崩れした

    • 2月18日のフェブラリーSを予想してみる

      はじめにいよいよG Iシーズン到来です。有馬記念をもとに色々と分析した結果を用いて予測してみたい。まだまだ、分析途中であるがあれこれ考えるのは楽しいものである。 スピードまずは距離や馬場を考慮せずにどれぐらいのスピードで走っているのか、入賞しているのかを見てみる。 単純にスピードだけ見るとシャンパンカラー、ドンフランキー、レッドルゼル、アルファマムが安定している。しかし、距離と合わせて見てみないといけない。 スピードと距離距離で赤色は1000~1400、青色は1500

      • 競馬についての仮説をチャットGPTで聞いてみる

        はじめに競馬データから様々な統計量を確認してみたが、目的を忘れるところであった。目的としては競馬データを使って6位以内までに入賞する競走馬についての仮説を検証していくことであった。 そこで、チャットGPTにどのような仮説があるか設定してもらった。あまり斬新な見方はなく「まあそうでしょうね」という内容である。 競馬における勝ち馬の予測をさせるためのチャットGPTへのプロンプトはなかなか難しいが、検証のためのデータセットと分析手法のアイデアを確認していくことはできそうだ。

        • 順位と相関が高い項目はあるか?

          はじめに時系列でスピードの推移などをみてきたが能力の高さを相対的に見るのは少し難しい。単勝だけを予測するにはそこそこ使えるかも知れないが、もちろん配当は良くない。 順位との相関関係そこで、馬によって順位に影響を与えているパラメータがあるのかを相関係数を計算して分析する。 それぞれ、以下のような影響があるかを考えてみた。 順位-馬番:内枠、外枠で順位に影響が与えているか 順位-体重変化:体重の変化が順位に影響を与えているか 順位-距離:距離は順位に影響を与えているか? 順位

        2月18日フェブラリーSの結果

          馬の能力を時系列データで分析する

          はじめに有馬記念の出走馬の速度から予測ができるか基本統計量について分析して、一部は使えそうな感じがする。 次に競走馬はやはり2歳〜5歳にかけて成長してどこかでピークを迎えると考えられるので様々な年齢の馬が揃う有馬記念の出走馬を時系列で比較すると更なる勝ち馬のヒントが得られるかもしれない。 時系列のスピード推移過去のレースから速度を求めて時系列に並べてみる。(オレンジの線は全体の平均タイム) 単純に折れ線グラフのみを見るとドウデュース(1位)、スターズオンアース(2位)はベ

          馬の能力を時系列データで分析する

          上り3Fで基本統計量を調べてみる。

          はじめに平均速度だけでもちゃんと統計的にみてみると馬の能力の違いが意外とわかるものだ。なので末脚最後の3ハロン(600m) の速度を見てみる。正確には加速度がわかれば面白そうだが今あるデータのみでは計算できないので平均的な速度で代用する。 上り3Fの基本統計量平均速度と同様に過去のレースから3Fを何秒で走破したかを時速に変換してヒストグラムで表してみた。距離としては1600~3000mぐらいまであるので下記の表では混ざっている状態である。当然、長い距離を走った後のラスト3

          上り3Fで基本統計量を調べてみる。

          ChatGPTを使う前にもう一度統計で考えてみる。

          はじめにやはり、いきなり競馬のデータをchatGPTにインプットして特徴や強い馬を識別してくれと言っても無理がある。当たり前過ぎて恥ずかしい。 競馬は何が面白いかというと膨大なデータと不確定要素を織り込んで勝つ馬を予測することだが、個人として様々な楽しみ方ができる。ひたすら単勝で1位の馬を予測したり、数十点買いで三連単や万馬券のみを当てることを楽しみにすることもできる。 もちろん、以前裁判であったように投資として8億注ぎ込んで10億儲けるというような強者もいる。 では

          ChatGPTを使う前にもう一度統計で考えてみる。

          有馬記念をチャットGPTを使ってじっくり分析してみる

          はじめにチャットGPTは当たり前ですが、丸投げで何かをしてくれるわけではありませんが、統計分析のやり方など手順を示してくれるので統計学の知識が全くなくても何らかの回答が得られます。 まだまだ、機械学習やデープランニングまで辿り着いていませんが、データセットの前処理や欠損値の処理など実践で学べるのはいいかなと思います。 さて、今年最後の有馬記念では過去20年間のレースの特徴と出走馬の能力を指数化して予測してみたいと思います。 レースの特徴「添付のデータは過去20年間の有馬記

          有馬記念をチャットGPTを使ってじっくり分析してみる

          12月17日朝日杯FSの結果

          予測ワイド:10, 1, 7, 8 (BOX) 結果ワイド:1-3(520円)/3-5(590円)/1-5(1,720円) 反省そもそも特定レース結果だけで3位以内に入る馬の予測など無理筋だがやってみて、予測もできませんとチャットGPTに怒られているのに、では走破タイムを予測してと強引に結果を求めただけなのでこの結果は当然。。 予測したい目的変数に対してどのようなデータを準備しないといけないのかよく考えないといけないですね。

          12月17日朝日杯FSの結果

          12月17日の朝日杯FSを予測してみた

          はじめに早速、チャットGPTを使って作成したモデルを用いて朝日杯FSの出馬表を入力データとして3位までに入る馬の予測をしてみます。 予測結果なんと、3位以内に入る馬がいないという結果。。10年のデータといっても朝日杯のみだけなのでデータが少なすぎるとのこと。 良いように考えれば、軸になる強い馬がいないということか? これでは予測できないので急遽、目的変数を走破タイムにしてモデルを作成し直します。タイムはランダムフォレスト回帰でモデルを構築するとのことです。 新モデルで

          12月17日の朝日杯FSを予測してみた

          チャットGPTの分析機能を使って機械学習のモデルを作成する

          競馬の予測のためにどのような分析が良いかのプロンプトをいろいろ試してみたが面白そうな分析方法は得られないですね。あまりにも賢いのでついつい斬新な答えを期待しますが、Web上にあるコンテンツ以上のものを新しく生み出してくれるわけではないので仕方ないです。 それならばと、まだ試していなかった旧code interpreter、今は新しくなって分析機能?を試してみます。(有料で使用しているので無料バージョンが利用できるかは分かりません) この機能を使って機械学習のモデルを作成し

          チャットGPTの分析機能を使って機械学習のモデルを作成する

          12月10日阪神ジュベナイルFの結果

          予測ワイド:3, 6, 7, 10, 13 (BOX) 結果ワイド:6-7(890円)/7-10(620円)/6-10(770円) 反省1,000円→2,280円(228%) 全部当たったがしっくりこない。持ちタイムと前日の調教の質をネットから調べた結果だけほとんど統計的な情報を使っていない。 勝ちタイムが1分32秒台と出走馬の過去の持ちタイムより相当速いので、過去の持ちタイムが早ければ良いということでもなさそうだ。 なかなか方向性が決まらないが、次週こそはもう少し納得で

          12月10日阪神ジュベナイルFの結果

          阪神ジュベナイルフィリーズを予測してみた

          はじめに前回、チャットGPTを使ってスピード指数を作ってみたかったが、残念ながら思っていた指数とは全然違う結果となった。このままでは使えないのでもう一度レースの勝ち馬の傾向から予測することにする。 過去の傾向を聞いてみるプロンプトは素直に 「阪神ジュベナイルフィリーズの過去のレースから勝ち馬の特徴を具体的な数値や傾向を元に説明して下さい。」 とします。 傾向に当てはめる特に深く考えずにデータを並べてみます。 レースタイムは1600mを走っていない馬もいるため走破タイム

          阪神ジュベナイルフィリーズを予測してみた

          チャットGPTを使ってスピード指数を作ってみる

          はじめに先のチャンピオンズカップのようにレースの傾向のみの情報で勝負するのは面白みに欠けるのでやはり馬の能力を考慮して予測したい。 馬のスピードを数値化するのに有名なところで西田式のスピード指数があります。もちろん万能ではないですが、様々な条件を指数化して比較する手法は画期的でした。 馬の能力を測る指数さて、チャットGPTではどのような指数を提案してくれるでしょうか? プロンプトは、次のようにします。 「あなたは統計学のプロフェッショナルです。 競走馬の能力を測るための

          チャットGPTを使ってスピード指数を作ってみる

          12月3日チャンピオンズカップの結果

          予測単勝:4,7 馬連:4-7/4-12/4-9/7-12/7-9 ワイド:4-7-12, 4-7-9 枠連:2-3 結果単勝:15 馬連:7-15 ワイド:7-15/5-15/5-7 枠連:4-8 反省過去の傾向から13番以降で勝った馬がいないということで15番を最初から除外していた時点で今回は半分以上当たらない。 競馬に惜しいはないが、4番と5番がクビ差なのでちょっとした運があれば結構な配当になっていたのが残念。。 チャットGTPを使った非常に簡単な傾向分析だけで「惜

          12月3日チャンピオンズカップの結果

          チャットGPTの情報でチャンピオンズカップを予測してみた。

          はじめに前回チャットGPTにチャンピオンズカップの過去10年の優勝馬の傾向を聞いたので、その情報をもとに予測したいと思います。 データはnetkeibaの情報を元に予測します。 傾向から予測するどのパラメータを採用するかは主観的になってしまいますが、今回が初めてということで勢いで決めます。 13番人気以下は苦戦・・・8, 10, 13番を除外 2枠~5枠が比較的有利・・・3,4,6,7,8,10,12,13→ 3,4,6,7,12番優先 3歳、4歳、5歳が好走しや

          チャットGPTの情報でチャンピオンズカップを予測してみた。