見出し画像

【競馬AI開発#3】1年分のレース結果データをまとめてテーブルにする

はじめに

この【競馬AI開発】シリーズでは、競馬予想AIを作ることを通して、機械学習・データサイエンスの勉強になるコンテンツの発信や、筆者が行った実験の共有などを行っていきます。

今回の記事は、以下の動画に補足を加えて簡単にまとめたものになります。

今回やること

前回に引き続き、まずはnetkeiba.comから2023年のレース結果のテーブルをスクレイピングにより取得して、Pythonで扱えるようにすることを目標にしています。

「レース結果のテーブル」とは、以下のようなURLにある、過去に行われたレースの結果がまとめられたテーブルのことです。
https://db.netkeiba.com/race/202301010101

今回のコードを実行することで、2023年の全てのレースについてこのテーブルを取得し、以下のようなPandas.DataFrameの形で全て繋げたものを作成することができます。

スクレイピングにより取得したレース結果テーブル

筆者のプロフィール

東京大学大学院卒業後、データサイエンティストとしてWEBマーケティング調査会社でWEB上の消費者行動ログ分析などを経験。
現在は、大手IT系事業会社で、転職サイトのレコメンドシステムの開発を行っています。


↓単品購入したい場合はこちら(内容は本記事と同じです)

動画中のソースコード

ここから先は

4,837字 / 2画像 / 1ファイル
・単品購入するより、マガジンの定期購読がお得です。(全て単品購入した場合の【半額】程度になります。) ・月の途中で入っても、その月に追加された有料記事は全て読めます。 ・「定期購読していない月」に追加された有料記事は読めませんので、面白いと思っていただけましたら、定期購読しておくことをおすすめします。

「競馬予想AIを1から作る」ことを通して、機械学習・データサイエンスの勉強になるコンテンツの発信や、筆者が行った実験の共有などを行っていき…

この記事が気に入ったらサポートをしてみませんか?