【競馬AI開発#3】1年分のレース結果データをまとめてテーブルにする
はじめに
この【競馬AI開発】シリーズでは、競馬予想AIを作ることを通して、機械学習・データサイエンスの勉強になるコンテンツの発信や、筆者が行った実験の共有などを行っていきます。
今回の記事は、以下の動画に補足を加えて簡単にまとめたものになります。
今回やること
前回に引き続き、まずはnetkeiba.comから2023年のレース結果のテーブルをスクレイピングにより取得して、Pythonで扱えるようにすることを目標にしています。
「レース結果のテーブル」とは、以下のようなURLにある、過去に行われたレースの結果がまとめられたテーブルのことです。
https://db.netkeiba.com/race/202301010101
今回のコードを実行することで、2023年の全てのレースについてこのテーブルを取得し、以下のようなPandas.DataFrameの形で全て繋げたものを作成することができます。
筆者のプロフィール
東京大学大学院卒業後、データサイエンティストとしてWEBマーケティング調査会社でWEB上の消費者行動ログ分析などを経験。
現在は、大手IT系事業会社で、転職サイトのレコメンドシステムの開発を行っています。
※本記事を購入しても良いですが、以下の定期マガジンを購読すると、 #1〜 #4の記事が980円でまとめて読めます。
動画中のソースコード
ここから先は
4,837字
/
2画像
/
1ファイル
¥ 980
この記事が気に入ったらチップで応援してみませんか?