データサイエンス研究所

競馬予想AIを作ることを通して、機械学習・データサイエンスの勉強になるコンテンツの発信…

データサイエンス研究所

競馬予想AIを作ることを通して、機械学習・データサイエンスの勉強になるコンテンツの発信や、筆者が行った実験の共有などを行っていきます。

マガジン

  • 【定期マガジン】競馬AI研究所

    「競馬予想AIを1から作る」ことを通して、機械学習・データサイエンスの勉強になるコンテンツの発信や、筆者が行った実験の共有などを行っていきます。 一度きりの「機械学習で競馬予想してみた」ではなく、「本格的に運用できる競馬予想AI」を作成するための技術を、ソースコードと共に公開。 記事は基本的に【隔週で土曜日の午後】に更新されます。

最近の記事

  • 固定された記事

【競馬AI開発#1】レース開催日一覧をスクレイピングで取得する

はじめにこの【競馬AI開発】シリーズでは、競馬予想AIを作ることを通して、機械学習・データサイエンスの勉強になるコンテンツの発信や、筆者が行った実験の共有などを行っていきます。 今回の記事は、以下の動画に補足を加えて簡単にまとめたものになります。 筆者のプロフィール 東京大学大学院卒業後、データサイエンティストとしてWEBマーケティング調査会社でWEB上の消費者行動ログ分析などを経験。 現在は、大手IT系事業会社で、転職サイトのレコメンドシステムの開発を行っています。

    • 【競馬AI開発#4】馬の過去成績データをスクレイピングで取得

      はじめにこの【競馬AI開発】シリーズでは、競馬予想AIを作ることを通して、機械学習・データサイエンスの勉強になるコンテンツの発信や、筆者が行った実験の共有などを行っていきます。 今回の記事は、以下の動画に補足を加えてまとめたものになります。 今回やること 今回はnetkeiba.comから「馬の過去成績データ」をスクレイピングにより集めて、一つのテーブルとして繋げていきます。 この「馬の過去成績テーブル」は、「予測したいレースに出走する馬が、過去にどんな成績を出してき

      有料
      980
      • 【競馬AI開発#3】1年分のレース結果データをまとめてテーブルにする

        はじめにこの【競馬AI開発】シリーズでは、競馬予想AIを作ることを通して、機械学習・データサイエンスの勉強になるコンテンツの発信や、筆者が行った実験の共有などを行っていきます。 今回の記事は、以下の動画に補足を加えて簡単にまとめたものになります。 今回やること前回に引き続き、まずはnetkeiba.comから2023年のレース結果のテーブルをスクレイピングにより取得して、Pythonで扱えるようにすることを目標にしています。 「レース結果のテーブル」とは、以下のようなU

        有料
        980
        • 【競馬AI開発#2】ChromeDriverによるレースid一覧のスクレイピング

          はじめにこの【競馬AI開発】シリーズでは、競馬予想AIを作ることを通して、機械学習・データサイエンスの勉強になるコンテンツの発信や、筆者が行った実験の共有などを行っていきます。 今回の記事は、以下の動画に補足を加えて簡単にまとめたものになります。 今回やること前回に引き続き、まずはnetkeiba.comから2023年のレース結果のテーブルをスクレイピングにより取得して、Pythonで扱えるようにすることを目標にしています。 そのためのステップについての全体感は、前回の

          有料
          980
        • 固定された記事

        【競馬AI開発#1】レース開催日一覧をスクレイピングで取得する

        マガジン

        • 【定期マガジン】競馬AI研究所
          ¥980 / 月

        記事

          【競馬AI開発#1】レース開催日一覧をスクレイピングで取得する

          はじめにこの【競馬AI開発】シリーズでは、競馬予想AIを作ることを通して、機械学習・データサイエンスの勉強になるコンテンツの発信や、筆者が行った実験の共有などを行っていきます。 今回の記事は、以下の動画に補足を加えて簡単にまとめたものになります。 筆者のプロフィール 東京大学大学院卒業後、データサイエンティストとしてWEBマーケティング調査会社でWEB上の消費者行動ログ分析などを経験。 現在は、大手IT系事業会社で、転職サイトのレコメンドシステムの開発を行っています。

          有料
          0〜
          割引あり

          【競馬AI開発#1】レース開催日一覧をスクレイピングで取得…

          【競馬AI開発#6】馬の過去成績の集計方法・レース情報テーブルの取得

          この【競馬AI開発】シリーズでは、競馬予想AIを作ることを通して、機械学習・データサイエンスの勉強になるコンテンツの発信や、筆者が行った実験の共有などを行っていきます。 ■今回やること 馬の過去成績データをどのように集計して特徴量にすれば良いのか? netkeiba.com上で非構造化データになっているレース情報データを、どのようにテーブル形式のデータにうまくまとめるか? について扱っていきます。 1についてですが、「その馬が過去どんな成績を上げてきたか」は重要な予

          有料
          980

          【競馬AI開発#6】馬の過去成績の集計方法・レース情報テー…

          【競馬AI開発#5】取得したレース結果テーブル・馬の過去成績テーブルを加工する

          この【競馬AI開発】シリーズでは、競馬予想AIを作ることを通して、機械学習・データサイエンスの勉強になるコンテンツの発信や、筆者が行った実験の共有などを行っていきます。 ■今回やること 今回は、netkeiba.comから取得した「レース結果テーブル」と「馬の過去成績テーブル」を前処理して、機械学習モデルにインプットできる形に加工していきます。 今回のコードを実行することで、上のrawデータが加工され、CSVで保存されるようになります。 import preproce

          有料
          980

          【競馬AI開発#5】取得したレース結果テーブル・馬の過去成…

          【競馬AI開発#4】馬の過去成績データをスクレイピングで取得

          はじめにこの【競馬AI開発】シリーズでは、競馬予想AIを作ることを通して、機械学習・データサイエンスの勉強になるコンテンツの発信や、筆者が行った実験の共有などを行っていきます。 今回の記事は、以下の動画に補足を加えてまとめたものになります。 今回やること 今回はnetkeiba.comから「馬の過去成績データ」をスクレイピングにより集めて、一つのテーブルとして繋げていきます。 この「馬の過去成績テーブル」は、「予測したいレースに出走する馬が、過去にどんな成績を出してき

          【競馬AI開発#4】馬の過去成績データをスクレイピングで取得

          【競馬AI開発#3】1年分のレース結果データをまとめてテーブルにする

          はじめにこの【競馬AI開発】シリーズでは、競馬予想AIを作ることを通して、機械学習・データサイエンスの勉強になるコンテンツの発信や、筆者が行った実験の共有などを行っていきます。 今回の記事は、以下の動画に補足を加えて簡単にまとめたものになります。 今回やること前回に引き続き、まずはnetkeiba.comから2023年のレース結果のテーブルをスクレイピングにより取得して、Pythonで扱えるようにすることを目標にしています。 「レース結果のテーブル」とは、以下のようなU

          【競馬AI開発#3】1年分のレース結果データをまとめてテーブルにする

          【競馬AI開発#2】ChromeDriverによるレースid一覧のスクレイピング

          はじめにこの【競馬AI開発】シリーズでは、競馬予想AIを作ることを通して、機械学習・データサイエンスの勉強になるコンテンツの発信や、筆者が行った実験の共有などを行っていきます。 今回の記事は、以下の動画に補足を加えて簡単にまとめたものになります。 今回やること前回に引き続き、まずはnetkeiba.comから2023年のレース結果のテーブルをスクレイピングにより取得して、Pythonで扱えるようにすることを目標にしています。 そのためのステップについての全体感は、前回の

          【競馬AI開発#2】ChromeDriverによるレースid一覧のスクレイピング