見出し画像

Mリーグ2021開幕!まずはデータをてれるようにしておかないとね!

今年も始まりましたMリーグ!
今シーズンは新しく参戦する選手も増えてますます楽しくなりそうです。
データ分析するにはまずデータがないと意味がないので、データを抽出しないとね。

成績は毎試合更新されていくので、推移なども把握したい場合は更新される前にデータを取っておかないといけません。
そのため、毎日更新されたらデータを取れるようにコードを作ります。
自動化してサイト更新とともに自動でスクレイピング等もできますが、不用意にアクセスもしたくありませんので、一度アクセスしてデータを取れば、整形してcsv出力できる形にします。

コードを以下になります。
自動化させる場合は特にサイトに負荷をかけたりしないようにご注意ください。
特にループ処理を間違えて、連続アクセスするような処理を書いてしまわないように気をつけてください。

import pandas as pd
import datetime
lists = pd.read_html('https://m-league.jp/stats')
df = pd.DataFrame()
teams = ['drivens','EX','sakura','konami','abemas','raiden','sega_summy','u-next']
j = 0
for i in lists:
   data = i
   data = data.T
   data.columns = data.iloc[0]
   data = data[1:]
   data['チーム'] = teams[j]
   j+=1
   df = pd.concat([df,data])
df.to_csv('MLeague_stats' + datetime.date.today().strftime('%Y-%m-%d') + '.csv')


よろしければサポートをよろしくお願いします。サポートいただいた資金は活動費に使わせていただきます。