見出し画像

個人成績から見たStatcastデータの欠損 ゴロ編


Statcastデータの欠損

 前回の分析では、個人成績からStatcastデータの欠損が生じるのかを分析しました。その結果、ゴロの欠損の多い打者は翌シーズンもゴロの欠損が多く、ゴロの欠損が少ない打者は翌年も少ないことを確認しました。他の打球ではこの傾向は認められませんでした。

 さて、ここで気になるのは「どういう打者の欠損が多いのか、もしくは少ないのか」ということです。今回はこのテーマについて検証してみたいと思います。

3年分のデータの集計と分類

 以下の図1はAlbert Pujols選手の2015年から2017年までのゴロの欠損率の推移を表したものです。

画像1

 Albert Pujols選手の1人分のデータだけでは、この欠損率が多いのか少ないのか、シーズン間で大きく変化しているのか、それとも安定しているのか判断できません。

 そこで2015年から2019年までに3年連続でゴロの速度と角度のデータが50以上ある打者を対象に3年分のゴロの欠損率のデータを抽出しました。その結果、図1のようなデータを述べ688人分を用意しました。

 このデータをクラスター分析(k平均法)という方法を用いて、3年間の欠損率のパターンが似た6つのタイプにデータを分類しました。各タイプの欠損率の平均値をまとめると以下の図2のようになります。

画像2

 各タイプの凡例で()内に示した値が該当する選手数になります。タイプによって欠損率の高さと変化に違いを確認できると思います。このうちType4は欠損率が10%程度と低く且つ安定しています。一方、Type5は欠損率が20%程度と高く且つ安定しています。

打者のリストアップ

 図2で示したType4とType5に該当する打者は、3年連続ゴロの欠損率を一定の水準でキープしているといえるわけですが、こうしたタイプの打者はいったいどんな打者なのでしょうか?そして、どのような要因によって欠損率の高さが決まっているのでしょうか?

 まずは、Type4とType5に該当する打者の名前を確認してみたいと思います。といっても、全員の名前を見るには少し多すぎるので、3年間の欠損率の標準偏差を求め、この値が低い順に10人の打者をそれぞれ抽出しました。欠損率が最も安定している打者をピックアップした形です。リストを以下の表1に示します。

画像3

 どうでしょう?選手の名前を見て各タイプの特徴としてピンとくるものはあったでしょうか?正直自分にはよくわからなかったので、Type4とType5に該当する打者の成績を見ていきたいと思います。

打撃成績の比較

 打撃成績の比較として、Type4とType5の打者の1打席あたりのゴロ数(GB/PA)とwOBAを比較したものを以下の図3-1と図3-2に示します。

画像4

 Type4とType5の特徴としては、Type5のほうが1打席あたりのゴロ数が多く、wOBAが低いということでしょうか。同じような成績の打者はType4にもいますが、Type5はどちらかというとゴロ型の打者が多く、打撃成績の優秀さを表すwOBAも低いのが特徴です。

Statcastデータの比較

 次にStatcastデータを比較してみたいと思います。まずは打球の速度と角度のデータを以下の図4-1に示します。

画像5

 続いて、ゴロ・ライナー・フライの打球別に集計したものを以下の図4-2から図4-4に示します。

画像6

画像7

画像8

 たくさん図を出しておいてアレですが、どうもこの図の形式はType4とType5の比較には向かないようです。そこで、欠損値を抜いた打球の速度の分布を打球別に集計したものを以下の図5-1から図5-3に示します。

画像9

 図5-1のゴロでの打球の分布にそれほど違いはありませんが、図5-2と図5-3のライナーとフライでは、Type4の分布が右に寄っており、打球速度が速いことを確認できます。

まとめ

 3年連続というMLBにおいては短いとはいえない期間において、一貫してゴロの欠損が多い、もしくは少ない打者を確認することができました。

 その特徴としては、ゴロの欠損の多い打者のほうが1打席あたりのゴロが多く、打撃成績の優秀さを表すwOBAは低く、そして打球の速度もライナーとフライで遅いことを確認できました。

 こうした特徴を見た感じ、ゴロの欠損の多いType5の打者は、それほどパワーに恵まれず、そのためゴロが多いのかなと感じます。しかし、他にもゴロが転がった位置と欠損の関係なども確認する必要もあり、今回のところはいくつか特徴を確認できたというところで留めておきます。

 次は、ゴロをもっと掘り下げても良いのですが、他の打球を先に確認してみようと思います。

画像:いらすとや

注:この分析で欠損値として扱っているデータは、以前の分析より打球の速度と角度の組み合わせから判断しています。しかし、MLBよりこのデータが欠損値であるという明記は無いので、あくまで欠損値の可能性が高い組み合わせを用いているものです。詳しくは以下のリンクを。


この記事が気に入ったらサポートをしてみませんか?