見出し画像

競馬で勝ちたい人必見。プログラミン初心者が最短でAI指数を0からつくる方法


この記事を閲覧されているという方は、競馬が好きな方でだからこそしっかりとした根拠の元で馬券を購入して勝ちたい!といった思いを抱えられているのではないでしょうか。私がAI予想を取り入れようと思った経緯もそういった感じです。小学生から競馬が大好きだった私は20歳で馬券が買えるようになってから競馬に夢中になりました。結果は年マイナス30万円ほど。。
当時、大学生の私には痛すぎました。でも、競馬が好きな私は決してやめることはできませんでした。なら、確実に勝とう。そう考え行き着いた先がこのAI予想です。まずは、pythonという言語自体の勉強から始め、、、機械学習の分野に触れ、統計学にも手を出し、、終いには"pythonデータ分析試験"というエンジニア認定の資格までとりました。。。(以下その証拠です)


ここまでの内容で諦めそうになった方、ちょっと待ってください!
前置きが長くなりました。ここでこの記事の結論から申しますと、”1ヶ月”あればだれでもオリジナルの指数、またはAI予想がつくれます。何ならプログラミンの知識などほぼ皆無でもなんとかなります。
これは決して大げさではなく、私の半年という期間が遠回りしすぎただけです。自分が遠回りしたかたこそ気づいた、最短でAI予想を作る方法を以下記します。

それでは実際にどのような方法で、最短でAI予想をつくるのか、
それは、ずばり「chatGPT」をフルで活用することです。
皆さんchatGPTご存じでしょうか。簡単に説明すると会話形式で何でも本当に何でも答えてくれるウェブサイトです。これは、プログラミングの分野でも大きな成果を発揮してくれます。例えば、書いているコードにエラーが出た場合、そのエラーとコードをコピーしてはりつけて「このエラーがでないように修正して」と問いかけるだけで、正しいコードを教えてくれます。

ここまでで、なんとなく自分にもできるのでは?と感じてくれましたでしょうか。それでは以下実際に1ヶ月でAI予想をつくるロードマップを記していきます。

1週間目・・・まずは、準備です。今回は”jupyter notebook"を使ってコードを実行します。こちらのダウンロード方法はWEBやYOUTUBEなどに多く出回っていますのでそちらを確認していただく方がわかりやすいかと存じます。次にchatGPTをログインしましょう。すでに利用されてる方は結構です。1週間目はこれだけでOKです。
というのも、最初はダウンロードするだけども、ファイルを保存、簡単なコードを実行するだけでも何回も躓いてしまうと思います。ですのでそのたびにまず、chatGPTに聞いてみましょう。質問内容を具体的にすればするほど正しい回答がかえってきます。

2週間目・・・ここで、過去のレース情報をスクレイピングしましょう。スクレイピングとはWEBの情報を取り出して、それをpython上で加工したり保存したりできるようにするものです。実際私は東京競馬場のレース結果を5年間分スクレイピングしようと始めました。実はここで3ヶ月を要しました。なぜなら、1からすべて自分でつくろうとしたからです。
大きく進歩したのは、そういったnet.keibaからスクレイピングする方法がweb上にたくさん出回っていると気づいてからです。
ずばり、簡単なやり方を記すと、「web上のコードをコピー」→「たぶん最初はエラーが出るのでそのたびにchatGPTで修正」これで絶対に完成します。
大変恐縮ですが、私のコードに関しては様々な観点から今後一切に世に出す気はございません。ご納得いただけましたら幸いです。

3週間目・・・次はデータの整理です。まず、ご理解いただきたいことが、pythonによる機械学習はデータの前処理が一番大切です。ここの前処理をいかに工夫するか、いかに多くのデータを仕入れるかによって完成度が変わってきます。
 ここでは実際に私がそのようなデータ加工を行ったかを解説します。
私は主なデータ加工にExcelを使いました。以下その流れです。
1.スクレイピングしたレース情報をExcelで開けるようにする。
2.Excel上で編集。具体的には騎手や調教師の名前などは実際の機械学習に使えない。そのため、数字化する必要がある。オーソドックスなのは勝率だと思います。
3.編集後のファイルを再度jupyterで保存しコードを実行出来るようにする。

以上が簡単な流れになります。繰り返しになりますが、テクニックの面でわからないことは全てchatGPTに聞けば良いです。私がここで書くよりもスマートに対応してくれるかと思います。

4週間目・・・あとは実行するだけです。ここでの方法は大きく2種類あるかと思います。1つ目は指数化する方法。これはおそらく回帰の分野になるかと思います。簡単に説明すると、y=ax+bx₁などの感じでyを目的変数ここでは着順としたときの説明変数の係数(aやb)を決定してもらうことがあります。血統重視の人、展開重視の人、騎手重視の人、それぞれ偏った予想がある中で、それぞれを予想に組み込むべき最適な比率を提示してくれます。これは、比較的に簡単でイメージしやすい物かと思います。
二つ目は強化学習です。これは、機械が勝手に学習してくれて勝手に予想結果をだしてくれるという物です。機械学習といってもひとくくり出来るものではありませんが、私の場合は3着以内や1着の馬を分類して学習していくプログラムを組みました。
この辺の話しは正直難し過ぎます。だからこそ、chatGPTです。笑



繰り返しになりますが結局chatGPTです。ただ、正しく使うには正しく質問をする必要があります。その正しく質問するためには大まかなイメージが必須です。その大まかなイメージを本記事で示せたのなら幸いです。

最後まで本記事をごらんいただき誠にありがとうございました。
最後になりましたが、私のTwitter予想のアカウントを添付します。フォローしていただいて、是非馬券の参考にしてください。

@ai_mo24




この記事が気に入ったらサポートをしてみませんか?