8行で完了!プロ野球スタメン打順集計
プロ野球スタメン打順データを集計して、今シーズン(2022年8月20日時点)の打順別出場数を見ていきたいと思います。
ライブラリをインポート
今回はデータの加工と可視化に使うpandasとmatplotlibを利用します。
ライブラリをimportしていきます。
import pandas as pd
import matplotlib.pyplot as plt
%matplotlib inline
データ読み込み
スタメンデータを読み込みます。
データは下の記事でスクレイピングする方法がわかりデータが取得できます。
df = pd.read_csv('starting_member.csv')
参考にしてください。
打順別に出場選手を集計して画像を可視化
今回は集計してそのまま縦棒グラフで可視化して結果を画像保存していきます。
for i in range(1,10):
data[str(i)+'番'].sort_values(ascending=False).plot(kind='bar',figsize=(20,5))
plt.title(str(i)+'番出場数')
plt.savefig(str(i)+'番スタメン.png')
1番から9番までのグラフの画像ファイルがこのプログラムの置かれている場所に出力されたら完了です。
各打順の出場数
可視化結果は1番〜9番まで貼り付けていきます。
見ていくと4〜5番は100試合近い出場選手が8名それぞれいます。
そこから9位以降は60試合と多くの球団が4〜5番が固定化され打線の軸が造られてる感があります。
7〜9番の下位打線になってくると、選手数が多く、入れ替えや様々な選手がスタメンになっていることがわかります。
それでも、固定化されている選手もいて、最も多い出場選手は100試合以上となっていて他の打順と変わらない出場数となっています。
参考書籍
今回の分析コード(有料)
今回の記事のコード(python)と画像ファイルをダウンロードすることができます。
よろしければサポートをよろしくお願いします。サポートいただいた資金は活動費に使わせていただきます。