野球で守備が代わった選手にボールが飛びやすいのは本当か?
こんにちは!
LINEマンガというマンガアプリのデータ分析をしているかつおといいます!
元高校球児で、オリックスファン。今年は現地も含めて、100試合以上観戦しました。惜しくも、日本一を逃しましたが、三連覇おめでとうございます🙌今年も最後まで楽しませていただき、ありがとうございました!!
さて、野球ではよく、「守備で交代すると、交代して入った選手にボールが飛びやすい」と言われることがありますが、本当かどうかプロ野球のデータを用いて、調べてみました!
10秒で読めるサマリー
2023年のプロ野球の1年間の試合のデータを分析し、守備交代があった際にそのポジションに打球が飛ぶ確率が一般的な確率と異なるかを検証しました。結果として、守備交代があった際には、打球が飛ぶ確率が24%と、通常時(7~20%)よりも高いことがわかりました。
※この分析は、ChatGPTと進め、スポーツニュースサイトからデータをスクレイピングして、カイ二乗検定を用いて独自に集計したものなので、いくつかの制限や考慮すべき点もあります。
詳細(じっくり読みたい方向け)
プロ野球における守備交代と打球の関係性の統計的分析
概要
野球の試合において、守備交代後に特定のポジションに打球が飛ぶ確率が、通常時と比較して高いかどうかを調べてみました。この分析は、以下のステップで進めています。
仮説立て: 守備交代後のポジションには、通常よりも打球が飛びやすいという仮説を検証。
データ収集: 今回はオープンなデータがなさそうだったので、プロ野球の試合データをスポーツのニュースサイトからスクレイピングで収集。
データ集計: 守備交代の有無と打球の飛来回数を集計。
分析: カイ二乗検定を用いて、守備交代が打球の確率に影響を与えるかを分析。
結論: 守備交代があった場合、打球が飛ぶ確率は24%と、通常の7~20%と比べて有意に高いことが確認されました。
データと分析方法の詳細
検証方法
「守備で交代した選手に打球が飛んでくる確率」と「通常時に各ポジションごとに打球が飛んでくる確率」を比較することで検証しました。
使用したデータ
2023年プロ野球の1年間の試合データ。
分析手法
Pythonを使用したスクレイピング、データ集計、カイ二乗検定。
分析内容
守備で交代した回に交代した選手に打球が飛んだ確率
守備で交代した回に選手に打球が飛んできた数 / 守備で交代した回に打球が飛んだ数
通常時に各ポジションごとに打球が飛んでくる確率
守備で交代していない回に選手に打球が飛んできた数 / 守備で交代していない回に打球が飛んだ数
ここでは、ファースト、セカンド、サード、ショート、レフト、センター、ライトの7ポジションのみの守備機会を集計対象としていて、ピッチャー、キャッチャーの守備機会、三振は含めていません。
7つのポジションに飛ぶ確率が一定だとすると、単純に1/7(約14%)ですが、ポジションによって守備機会に偏りがないかを見たかったので、ポジションごとに集計しました。
ポジションによって、守る範囲の広さが違うとはいえ、ファースト、サードとセンターで2倍以上飛んでくる率が変わるというのは意外でした!
結果
守備で交代した回に交代した選手に
打球が飛んだ割合は24%で、
通常時に、7つのポジションに打球が飛ぶ確率は、単純に約14%(1/7)、各ポジションごとに見ても、7〜20%の間に収まっているので、直感的にも、「守備で交代すると、交代して入った選手にボールが飛びやすい」と言えそうです。
また、詳細は割愛しますが、守備交代した回に打球が飛んだ回数と、通常時に打球がくる割合を用いて、カイ二条検定を使えば、統計的に優位な差があることも示すことができます。
考慮すべき点
この結果は興味深いのですが、あくまで守備交代と、打球の方向に関連があることを示しただけなので、因果関係はわかりません。つまり、「守備交代することが、交代した選手に打球が飛ぶ」ことを引き起こすかどうかは不明です。
また、球団ごとの特性、試合展開、ピッチャーの配球、相手の打線など、多くの外部要因が分析結果に影響を与える可能性があります。
例えば、ある抑えのピッチャーを使ったときは、レフト方向への打球が多いので、事前にレフトを交代した。
あるいは、ある球団はショートがめちゃくちゃ上手いので、なるべくショートに飛ばすような配球をしているなどといった要因を考慮できていないです。
繰り返しになりますが、ファースト、セカンド、サード、ショート、レフト、センター、ライトのみの守備機会を集計対象としていて、ピッチャー、キャッチャーの守備機会、三振は含めていません。
2023年の1年間のみのプロ野球の公式戦の試合データを使っているので、数年分に範囲を広げたり、高校野球などを含めると結果は変わるかもしれません。
また、スクレイピングによる独自のデータ収集なので、正確に集計できてない可能性があります。
終わりに
最後まで読んでくださってありがとうございました!ずっと調べたいと思っていたことがまとめられてよかったです。
この分析を進めるにあたって、ChatGPTのサポートでめちゃくちゃはかどりました。分析の流れの確認、TODOリストの作成、Pythonによるスポーツニュースサイトからのスクレイピング(データをそろえるのが一番大変でした💦)、集計、結果の検証と、文章化など。ありとあらゆるところで、聞きまくってました。ちなみにこの投稿の画像も、実はChatGPTに作ってもらっています。
予想していたよりも、内容が長くなってしまったので、ChatGPTとの進め方や、実際に使ったコードなども今後まとめられたらと思います。
この記事が気に入ったらサポートをしてみませんか?