外国人選手の打球データからNPBでの活躍を予測する
2015年以降にトラックマンによる打球データのトラッキングが始まり現在ではそれらのデータが公開されています。以前に打球以外のデータを使ってマイナー選手の成績を予測したことがあるのですがその時公開したものとは別に打球以外の指標(K%やBB%やISOやwRC+から)NPBでの打席当たり打撃貢献度(wRC+)を予測したのですがほとんど予測できないという結果になりました。打球データだったらもうちょっと予測の役に立つのではないか?と思い分析しようと思いました。
検証
NPB移籍前にMLB通算で150打席以上立っていてNPBで初年度に200打席以上立った選手を対象とします。
対象となったのは以上の選手15人です。トラッキングデータの公開が始まったのが最近であること、NPBで200打席以上立つほど起用されている選手が少ないということもあってどうしてもサンプルの数が小さくなってしまいました。そういうわけなのでこれから紹介するデータはサンプルが少ないということを気を付けてください。(正直サンプルがたまるまであと何年か経ってからまたやったほうがいいかもしれないですね)
この対象の選手と各種指標とwRC+の相関をとります。相関係数が高いほどNPBでの活躍を予測できる指標、ということになります。
(wRC+とは単打、本塁打、アウトなどのイベントの得点価値を基に重みづけをし球場等の影響を補正した打席当たりでどれだけチームの得点を増やすのに貢献したのかを表す指標です)
wOBA
まずは打球データを使わない基本的なスタッツからどれだけNPBで活躍できるかの予測をしてみます。使うのはwOBAです。前述のwRC+に球場補正がかかっていない簡易版のようなものと理解してくださればいいと思います。
MLBでのwOBAとNPBでのwRC+の散布図が以上となります。相関係数は0.05でほとんど相関がないという結果になりました。基本的なスタッツからNPBでの活躍を予測することはほとんどできないようです。
wOBAcon
続いてはwOBAconです。wOBAconはwOBAの計算式から打球結果を除外し打球に限定したものです。
MLBでのwOBAconとNPBでのwRC+の散布図が以上となります。相関係数は0.32で弱い相関があるという結果になりました。打球結果を考慮したwOBAよりも打球に限定したwOBAconの方が予測の精度が高いという結果になりました。
ISOcon
続いてはISOconです。ISOとは純粋な長打力を表す指標です。そのISOから非打球結果(三振)を計算から除外したのがISOconです。
(計算式は(3×本塁打+2×三塁打+二塁打)÷(打数-三振)です。)
MLBでのISOconとNPBでのwRC+の散布図が以上となります。相関係数は0.49で相関があるという結果になりました。単打を考慮したwOBAconよりも打球かつ長打力に限定したISOconの方が予測の精度が高いという結果になりました。
HR/BBE
HR/BBEは本塁打/打球で計算されます。打球がどれだけ本塁打になったかを表す指標です。
計算式は 本塁打÷(打数-三振) です。
相関係数は0.52となりました。わずかですが長打の値によって重みづけされたISOconよりも高い精度で予測できる、という結果になりました。
Hard%
Hard%はfangraphsのBattedBallに掲載されている打球中の強い打球の占める割合の事です。
相関係数は0.75となりました。今回調査した指標ではこのHard%が最もNPBでの活躍を予測できる指標でした。
xwOBA
ここからはトラッキングデータを使っていきます。始めにxwOBAです。xwOBAとは三振、四死球といった非打球結果については実際の得点価値を、打球については打球の速度と角度から推定した得点価値を基にしたwOBAで推定される打席あたりの得点創出を表しています。
MLBでのxwOBAとNPBでのwRC+の散布図が以上となります。相関係数は0.34で弱い相関があるという結果になりました。打球データをつかってあげた方が多少はNPBでの活躍を予測しやすくなるようです。
xwOBAcon
続いてはxwOBAconです。xwOBAconとは三振、四死球といった非打球結果を除外し、打球については打球の速度と角度から推定した得点価値を基にしたwOBAで推定される打球あたりの得点創出を表しています。conはコンタクトのことです。
MLBでのxwOBAとNPBでのwRC+の散布図が以上となります。相関係数は0.59で相関があるという結果になりました。非打球結果を考慮したxwOBAよりも非打球結果を考慮していないxwOBAconの方が相関が高いという結果になりました。MLBでの非打球結果はNPBでの活躍を予測をするうえでむしろノイズになるのかもしれません。
打球速度
続いては打球速度です。単位はマイル(MPH)です。
相関係数は0.36となりました。wOBAよりは予測ができる、というもののxwOBAconほどではないようです。打球の速度だけでなく角度も重要な要素と言うことかもしれません。
Barrel%
続いてはBarrel%です。BarrelについてはMLB公式のBarrelの解説ページを参考にするのが良いと思います。
凄い大雑把に言えば打球速度と打球角度から打率.500以上かつ長打率1.500を記録することが推定される打球の事です。速度約160キロで25~31度の間の角度で放たれた打球がだいたいそうなるとイメージしてもらえばいいと思います。
そのBarrelの打球に占める割合を表したのがBarrel%です。
相関係数は0.64となります。xwOBAconよりも高いという結果になりました。
HardHit%
HardHit%は打球のうち打球速度95マイル(152.9km/h)以上の打球を打った割合です。(角度は考慮しません)
HardHit%の相関係数は0.50となりました。これまでの指標で見ても角度を考慮してあげた指標の方が良い結果が出ていることからもわかるように速度だけでなく角度も考慮した方が良さそうです。
まとめ
各指標とNPBでのwRC+の相関係数をまとめたものが以下になります。
サンプルとなる選手が15人しかいないことに注意してください。これからサンプルが増えるのを待ってどうなるか注目していきたいです。
またHR/BBEが意外にも一部のトラッキングデータ(打球速度とxwOBAとHardHit%)を上回っています。簡易的な指標の割には予測に使いやすいなと思いました。またトラッキングデータよりも人力で打球が分類されていると思われるHard%のが相関が高いというのも面白かったです。(サンプルが少ないためという可能性もあるかもですが)
ちなみにサンプルサイズがさらに少なくなってしまいますが右打者に限定した方がBarrel%の予測の精度は上がりました。
以下元データ
この記事が気に入ったらサポートをしてみませんか?