見出し画像

【野球統計学】大谷翔平_ホームランが生まれる最適な状況を探る

今日はデータ分析の力を借りて、ホームランが最も生まれやすいシチュエーションと、逆に最も打ちにくい状況について探ってみたいと思います。


はじめに

野球の試合を見ていると、「この状況ならホームランが出るかも!」と思うことがありますよね。では、実際にデータから見てみると、どんな状況が本当にホームランに有利なのでしょうか?下記のデータから読み取ってみましょう。

sportsNavi

分析方法

今回の分析では、カウント(ボール・ストライクの数)と塁状況(ランナーの有無)の両方を回帰分析の最小二乗法を用いて分析してみました。

import pandas as pd
import statsmodels.api as sm

# カウント別データ
count_data = {
    'Situation': ['0-0', '0-1', '0-2', '1-0', '1-1', '1-2', '2-0', '2-1', '2-2', '3-0', '3-1', '3-2'],
    'HomeRuns': [24, 10, 4, 12, 17, 11, 4, 9, 9, 2, 1, 7],
    'AtBats': [75, 61, 44, 33, 43, 104, 11, 34, 99, 2, 7, 75]
}

# 塁状況別データ
base_data = {
    'Situation': ['なし', '一塁', '二塁', '一二塁', '三塁', '一三塁', '二三塁', '満塁'],
    'HomeRuns': [31, 30, 10, 13, 5, 5, 7, 9],
    'AtBats': [348, 110, 36, 19, 46, 9, 11, 9]
}

# データフレームの作成と結合
df_count = pd.DataFrame(count_data)
df_base = pd.DataFrame(base_data)
df = pd.concat([df_count, df_base], ignore_index=True)

# 本塁打率の計算
df['HomeRunRate'] = df['HomeRuns'] / df['AtBats']

# 回帰分析の実行
df = pd.get_dummies(df, columns=['Situation'], drop_first=True)
X = df.iloc[:, 3:]  # 最初のカテゴリ(0-0)を基準にして残りのカテゴリを独立変数とする
y = df['HomeRunRate']
X = sm.add_constant(X)  # 定数項(切片)を追加
model = sm.OLS(y, X).fit()

print(model.summary())

# 係数をソートして最大と最小を取得
coefficients = model.params[1:]  # 切片を除外
max_coef = coefficients.idxmax()
min_coef = coefficients.idxmin()

print(f"\n最もホームランが打ちやすい状況: {max_coef.replace('Situation_', '')}")
print(f"最もホームランが打ちにくい状況: {min_coef.replace('Situation_', '')}")
  1. カウント別の打席結果(0-0、0-1、0-2、...、3-2)

  2. 塁状況別の打席結果(ランナーなし、一塁、二塁、...、満塁)

この方法を使うと、様々な状況がホームラン率にどれくらい影響を与えているかを数値化できるんです。

分析結果

さて、結果はどうだったでしょうか?

最もホームランが打ちやすい状況

分析の結果最もホームランが生まれやすいのは・・・なんと「満塁」の状況だったんです!

これは意外な結果かもしれません。でも考えてみると納得できる面もありますよ。満塁では投手が慎重になりがちで、結果的に打者にとって狙いやすい球が来る可能性が高くなるのかもしれません。

最もホームランが打ちにくい状況

一方で最もホームランが出にくいのは「0-2」のストライクで追い込まれたカウントです。

これは多くの野球ファンの直感とも一致する結果だと思います。0-2のカウントでは打者が守りの姿勢になり安全球を狙いがちです。そのため大振りしてホームランを狙うのは難しくなるんですね。

考察

この分析結果から、いくつかの興味深い点が浮かび上がってきます。

  1. 塁状況の重要性:満塁の状況がホームラン率に大きな影響を与えていることが分かりました。これは戦略を立てる上で重要な情報になりそうです。

  2. カウントの影響:0-2のような不利なカウントでは、やはりホームラン率が低下することが確認。

  3. 複合的な要因:ホームラン率は単一の要因ではなく、カウントと塁状況の両方に影響されることが明らかになりました。

注意点

ただし、この分析にはいくつかの限界があることも忘れてはいけません。

  • データ数の問題:満塁や3-0のカウントのような稀な状況では、サンプル数が少なく、結果が偏っている可能性があります。

  • 他の要因:投手の特性、球場の特徴、天候など、今回考慮していない要因もホームラン率に影響を与えている可能性もある。

まとめ

今回の分析で、ホームランが生まれやすい状況について、データに基づいた新しい視点を得ることができました。満塁の状況がホームランに有利だという発見は、特に興味深いものでしたね。

次に野球を観戦するときは、こういった状況にも注目してみてはいかがでしょうか?きっと、試合の見方が少し変わるはずです。

最後に、野球の魅力は統計だけでは語り尽くせないことも付け加えておきましょう。予想外の大逆転ホームランなど、データでは説明できない劇的な瞬間こそが、野球の醍醐味なのかもしれませんからね。

それでは。

この投稿は私が働いている現場のスタッフへ届けているメッセージです。もし共感をいただけたのであれば幸いです。