見出し画像

8行で完了!プロ野球スタメン打順集計

プロ野球スタメン打順データを集計して、今シーズン(2022年8月20日時点)の打順別出場数を見ていきたいと思います。

ライブラリをインポート

今回はデータの加工と可視化に使うpandasとmatplotlibを利用します。
ライブラリをimportしていきます。

import pandas as pd
import matplotlib.pyplot as plt
%matplotlib inline

データ読み込み

スタメンデータを読み込みます。
データは下の記事でスクレイピングする方法がわかりデータが取得できます。

df = pd.read_csv('starting_member.csv')

参考にしてください。

打順別に出場選手を集計して画像を可視化

今回は集計してそのまま縦棒グラフで可視化して結果を画像保存していきます。

for i in range(1,10):
   data[str(i)+'番'].sort_values(ascending=False).plot(kind='bar',figsize=(20,5))
   plt.title(str(i)+'番出場数')
   plt.savefig(str(i)+'番スタメン.png')

1番から9番までのグラフの画像ファイルがこのプログラムの置かれている場所に出力されたら完了です。

各打順の出場数

可視化結果は1番〜9番まで貼り付けていきます。
見ていくと4〜5番は100試合近い出場選手が8名それぞれいます。
そこから9位以降は60試合と多くの球団が4〜5番が固定化され打線の軸が造られてる感があります。
7〜9番の下位打線になってくると、選手数が多く、入れ替えや様々な選手がスタメンになっていることがわかります。
それでも、固定化されている選手もいて、最も多い出場選手は100試合以上となっていて他の打順と変わらない出場数となっています。

1番スタメン

2番スタメン

3番スタメン

4番スタメン

5番スタメン

6番スタメン

7番スタメン

8番スタメン

9番スタメン

参考書籍

今回の分析コード(有料)

今回の記事のコード(python)と画像ファイルをダウンロードすることができます。

ここから先は

29字 / 2ファイル
この記事のみ ¥ 100

よろしければサポートをよろしくお願いします。サポートいただいた資金は活動費に使わせていただきます。