マガジンのカバー画像

【定期マガジン】競馬AI研究所

「競馬予想AIを1から作る」ことを通して、機械学習・データサイエンスの勉強になるコンテンツの発信や、筆者が行った実験の共有などを行っていきます。 一度きりの「機械学習で競馬予想…
単品購入するよりマガジンの定期購読がお得です(全て単品購入した場合の半額以下になります)。 月の途…
¥980 / 月
運営しているクリエイター

#競馬AI

【競馬AI開発#12】競馬予想AIには何年間のデータを学習させるべきか?

この【競馬AI開発】シリーズでは、競馬予想AIを作ることを通して、機械学習・データサイエンスの勉強になるコンテンツの発信や、筆者が行った実験の共有などを行っていきます。 ■今回やること 今回は、機械学習モデルに学習させるデータを追加するためのコードを整えると同時に、データ量による精度を比較し、何年分のデータを学習に使用するのが最適なのか?検証していきます。 機械学習ではこのように、一部のデータを学習させずに検証用とすることで、未知のデータに対する予測シミュレーションを行い

¥1,000

【競馬AI開発#11】的中率・回収率のシミュレーションを作成する

この【競馬AI開発】シリーズでは、競馬予想AIを作ることを通して、機械学習・データサイエンスの勉強になるコンテンツの発信や、筆者が行った実験の共有などを行っていきます。 ■今回やること 今回は、機械学習を使って実際に馬券を買った際の的中率・回収率のシミュレーションを行います。 今回のコードを実行することで、以下のように各馬券の的中率(hitrate)・回収率(returnrate)を、人気順に買った場合と比較して出力することができます。 evaluator = Eval

¥1,000

【競馬AI開発#10】払い戻しテーブルを取得・前処理する

この【競馬AI開発】シリーズでは、競馬予想AIを作ることを通して、機械学習・データサイエンスの勉強になるコンテンツの発信や、筆者が行った実験の共有などを行っていきます。 ■今回やること 前回の記事では予測時のコードが完成し、学習〜予測までの一通りの流れが完成しました。 ここからは、精度を上げて回収率100%超えを目指していきます。 それにあたって、まずは回収率のシミュレーションをする必要があります。 そのために各馬券の払い戻し情報が必要なので、netkeiba.comの

¥480

【競馬AI開発#9】予測時のコードを作成して競馬AIを完成させる

この【競馬AI開発】シリーズでは、競馬予想AIを作ることを通して、機械学習・データサイエンスの勉強になるコンテンツの発信や、筆者が行った実験の共有などを行っていきます。 ■今回やること 今回は、実際の予測時におけるコードを作成します。 今回のコードが完成すると、出馬表からデータを取得し、機械学習による予測結果を出力することができます。 ▼実行コード from feature_engineering import PredictonFeatureCreatorpfc =

¥1,980

【競馬AI開発#8】機械学習モデルを作成して単勝馬券を予測する

この【競馬AI開発】シリーズでは、競馬予想AIを作ることを通して、機械学習・データサイエンスの勉強になるコンテンツの発信や、筆者が行った実験の共有などを行っていきます。 ■今回やること 今回は、LightGBMを使って機械学習モデルを作成し、実際に単勝予測モデルを作っていきます。 今回作成するコードを以下のように実行することで、機械学習モデルが学習され、完成したモデルファイルが自動的に保存されます。 trainer = Trainer()evaluation_df =

¥1,000

【競馬AI開発#6】馬の過去成績の集計方法・レース情報テーブルの取得

この【競馬AI開発】シリーズでは、競馬予想AIを作ることを通して、機械学習・データサイエンスの勉強になるコンテンツの発信や、筆者が行った実験の共有などを行っていきます。 ■今回やること 馬の過去成績データをどのように集計して特徴量にすれば良いのか? netkeiba.com上で非構造化データになっているレース情報データを、どのようにテーブル形式のデータにうまくまとめるか? について扱っていきます。 1についてですが、「その馬が過去どんな成績を上げてきたか」は重要な予

¥1,000

【競馬AI開発#5】取得したレース結果テーブル・馬の過去成績テーブルを加工する

この【競馬AI開発】シリーズでは、競馬予想AIを作ることを通して、機械学習・データサイエンスの勉強になるコンテンツの発信や、筆者が行った実験の共有などを行っていきます。 ■今回やること 今回は、netkeiba.comから取得した「レース結果テーブル」と「馬の過去成績テーブル」を前処理して、機械学習モデルにインプットできる形に加工していきます。 今回のコードを実行することで、上のrawデータが加工され、CSVで保存されるようになります。 import preproce

¥1,000

【競馬AI開発#4】馬の過去成績データをスクレイピングで取得

はじめにこの【競馬AI開発】シリーズでは、競馬予想AIを作ることを通して、機械学習・データサイエンスの勉強になるコンテンツの発信や、筆者が行った実験の共有などを行っていきます。 今回の記事は、以下の動画に補足を加えてまとめたものになります。 今回やること 今回はnetkeiba.comから「馬の過去成績データ」をスクレイピングにより集めて、一つのテーブルとして繋げていきます。 この「馬の過去成績テーブル」は、「予測したいレースに出走する馬が、過去にどんな成績を出してき

【競馬AI開発#3】1年分のレース結果データをまとめてテーブルにする

はじめにこの【競馬AI開発】シリーズでは、競馬予想AIを作ることを通して、機械学習・データサイエンスの勉強になるコンテンツの発信や、筆者が行った実験の共有などを行っていきます。 今回の記事は、以下の動画に補足を加えて簡単にまとめたものになります。 今回やること前回に引き続き、まずはnetkeiba.comから2023年のレース結果のテーブルをスクレイピングにより取得して、Pythonで扱えるようにすることを目標にしています。 「レース結果のテーブル」とは、以下のようなU

【競馬AI開発#2】ChromeDriverによるレースid一覧のスクレイピング

はじめにこの【競馬AI開発】シリーズでは、競馬予想AIを作ることを通して、機械学習・データサイエンスの勉強になるコンテンツの発信や、筆者が行った実験の共有などを行っていきます。 今回の記事は、以下の動画に補足を加えて簡単にまとめたものになります。 今回やること前回に引き続き、まずはnetkeiba.comから2023年のレース結果のテーブルをスクレイピングにより取得して、Pythonで扱えるようにすることを目標にしています。 そのためのステップについての全体感は、前回の

【競馬AI開発#1】レース開催日一覧をスクレイピングで取得する

はじめにこの【競馬AI開発】シリーズでは、競馬予想AIを作ることを通して、機械学習・データサイエンスの勉強になるコンテンツの発信や、筆者が行った実験の共有などを行っていきます。 今回の記事は、以下の動画に補足を加えて簡単にまとめたものになります。 筆者のプロフィール 東京大学大学院卒業後、データサイエンティストとしてWEBマーケティング調査会社でWEB上の消費者行動ログ分析などを経験。 現在は、大手IT系事業会社で、転職サイトのレコメンドシステムの開発を行っています。