外国人選手の重回帰分析の続きと今季の新外国人選手成績予測

前回の続き。

外国人選手の成績について目的変数をNPB1年目のwRC+、説明変数を体重とMLB時代の通算オフスピードボール(チェンジアップ+スプリット)の被投球割合にして重回帰分析を行いました。

NPB1年目に200打席、来日前にMLBで通算100打席以上記録した47選手(再来日したマギーも含めて48個のデータ)を対象としています。コーナーポジションの選手とセンターラインの選手を一緒にしてしまうとノイズになると考えコーナーポジションの選手に限定しています。

元になったデータがこちらです。

予測

重回帰分析の結果

重回帰分析を行った結果が以下となります。

重回帰分析 コーナーポジション

重決定は0.32となりました。

予測式は

 1.0x1 - 4.8x2 + 82 (x1:体重 x2:オフスピードボールの投球割合)

となりました。

体重のp値が0.05を下回っているのは体重が打者の長打力のポテンシャルを示していてオフスピードボールのp値が0.05を下回っているのは左右どちらの打席に立つかという打者の情報を含んでいるのに加えてオフスピードボールに弱い(と相手バッテリーに思われている)かを示しているのではないかなあと予測していますが因果関係はよくわかってません。とりあえず入れてみたって感じです。

新外国人選手の成績予測

重決定が0.25を上回ってるので予測式を使って新外国人選手の成績予測をしてみます。MLB通算100打席以上のコーナーポジションの選手、にしようかと思いましたがクロン(98打席)も対象に入れてみます。

成績予測

予測式で予測した結果は以上のようになりました。重決定は0.32程度ですが元データの方をみていただければわかるように予測式を使っても実際はズレもありますし他にも200打席に満たない選手のデータを取り込めていない、何より野球の成績は偶然の影響を取り込みやすいので何とも言えないところではあります。(他にも実力を発揮する前に見切られたり環境への適応等の要素も考えられます)とはいえ野球未経験者の自分が当てずっぽうに予測するよりはマシかなあ程度には思います。

追記 対左右別K%を考慮する

ビヤヌエバやボーアなど対左右別成績で差がある選手はNPBでは苦労してるイメージがあるので両方の利き腕の投手を相手に60打席以上立って左投手のK%と右投手のK%の差の絶対値を説明変数に使います。(K%を使うのは少ないサンプルサイズでもあてになるため)ただこれをやると少ないサンプルがさらに少なくなってしまうのですが……。

元のデータがこちら。

訂正 L minus R

ブラッシュやボーアなど予測の精度が上がった選手もいればオースティンなど下がった選手もいます。全体的な精度はどうでしょうか。

重回帰 L minus R

重決定は0.32→0.34と多少良くなったみたいです。サンプルが少なくなってしまったのが心もとないですが。p値を見てみると左右のK%の差は有意なようです。左右別成績のような何か明確な弱点がある選手は活躍しにくいのかもしれません。この辺りは外国人枠がないので苦手な利き腕の選手が出てきたらベンチに引っ込めるプラトーン起用で成績が維持しやすいMLBと外国人枠があるのでプラトーンなどできずにレギュラーで使い続けるNPBという違いが影響してくるのかなと推測していますが因果関係ははっきりとはわかりません。

予測式は

0.94 x1 + -4.39 x2 -2.96 x3 (x1:体重、x2:オフスピードボールの被投球率 x3:左右のK%差の絶対値)+93.8

となりました。

とりあえず左右の差補正を考慮した新外国人の成績予測をしてみます。MLBで左右どちらでも60打席以上経験してる打者が対象です。

新外国人選手 成績予測

左右のK%差が少ないのが影響したのかテームズ、ロドリゲスは予測による評価が上昇しました。一方で左右のK%差が大きいスモークは評価が下降しました。他にも良さそうな要素を見つけ次第今後もアップデートしたいです。

この記事が気に入ったらサポートをしてみませんか?