見出し画像

球界を代表するエースと進化するか!?佐々木朗希選手と山本由伸選手比較してみた

昨シーズンは4月からいきなり完全試合を成し遂げた佐々木朗希選手が今シーズン更なる進化を遂げようとしています。
昨シーズンは投手のタイトルを総なめした山本由伸選手を今シーズン佐々木朗希選手が取れるのか注目でもあります。
そこで、今シーズンは始まって1ヶ月ですが、佐々木朗希選手と山本由伸選手のこれまでの成績を比較して分析したいと思います。

分析のコードを載せながら分析をしていきます。
有料でコードとデータもダウンロードできます。

変数宣言

import pandas as pd
import matplotlib.pyplot as plt
import numpy as np
import seaborn as sns
import warnings
warnings.simplefilter("ignore")
%matplotlib inline

データ取得

データをクローリングして取得します。
データ取得下は下記になります。

data = pd.read_html('https://baseball-data.com/stats/pitcher-pa/era-4.html')

データ加工

取得したデータはリスト型で二重カラムになっているので、データフレーム型として代入して二重カラムを外します。

df = data[0]
df.columns = df.columns.droplevel(0)

佐々木朗希と山本由伸選手を抜き出します。

df2 = df.query('選手名 in ["佐々木 朗希","山本 由伸"]')

K/BBを算出します。

df2['K/BB'] = df2['奪 三 振'] / (df2['与 四 球'] + df2['与 死 球'])

BABIPを算出します。

df2['BABIP']=(df2['被 安 打']-df2['被 本 塁 打'])/(df2['打 者']-df2['奪 三 振']-df2['被 本 塁 打'])

グラフ化した時に選手名を出すため選手名をindexに指定します。

df2.index = df2['選手名']

分析

データ加工が済みましたので分析をしていきます。

試合数

試合数は山本由伸選手が1試合多い登板です。
佐々木選手も5試合とGWまで1週間ペースで登板しています。
今シーズンは1年間ローテーションを守り、登板ペースも中5〜6日でまわせるかが重要な年になります。
もしローテーションの1〜2人目となってくれば、球界トップのエースになること間違い無いでしょう。

df2['試 合'].plot(kind='bar',color='lightgray')

投球回

投球回数は山本由伸投手が38.1と約6回佐々木朗希投手より多いです。
1試合分の投球回数が多い計算になります。
そのためほぼ互角でしょう。

df2['投 球 回'].plot(kind='bar',color='gray')
plt.ylabel('投球回')
df2['投 球 回']

WHIP

WHIPは佐々木朗希投手が0.6を下回る驚異的な数値です。
開幕から好調をキープしています。
対して山本由伸投手は1.2と悪くは無いですが、平均的な数値になっています。
山本由伸投手としては物足りない数値です。
少し調子が悪そうに見えます。

df2['W H I P'].plot(kind='bar',color='lightgreen')

BABIP

今の成績に運の要素を計るBABIPです。
山本由伸投手は0.300と一般的に落ち着く数値です。
対して佐々木朗希投手は0.2とかなり低い数値です。
この数値は0.3に落ち着いてくると、防御率等が上がってくるので、今がかなり調子が良い証拠といえます。
この数値は1年のシーズンくらいはBABIPが低く、防御率がかなり低いシーズンになることもありますので、
今シーズン佐々木朗希投手が更なる進化を遂げ、山本由伸投手が総なめにしてきたタイトルを奪い取ることも十分可能性があります。

df2['BABIP'].plot(kind='bar',color='orange')

K/BB

K/BBは佐々木朗希投手が約7、山本由伸投手が3.5です。
どちらも良い数値ですが、佐々木朗希投手が先発としては驚異的な数値です。
パワーで奪三振をもぎとるピッチングがキレッキレです。

df2['K/BB'].plot(kind='bar',color='pink')
df2['K/BB']

十分佐々木朗希投手はタイトルを取れる

開幕から好調の佐々木朗希投手、驚異的な数値で山本由伸投手を凌駕する成績を今シーズンは残しています。
怪我せずシーズンを終えられれば確実にタイトルを取れそうです。

今回分析で用いたデータをcsvで出力します。

df2.to_csv('YamamotoVSSasaki.csv')

今回の分析のコードとデータはこちら(有料)

ここから先は

50字 / 2ファイル
この記事のみ ¥ 200

この記事が参加している募集

野球が好き

よろしければサポートをよろしくお願いします。サポートいただいた資金は活動費に使わせていただきます。