新外国人のMLB時代の成績からNPBでの活躍を予測する+新外国人の成績予測

重回帰分析という分析手法があります。回帰分析とはあるデータから別のデータの値を予測する分析手法です。重回帰分析の基礎については以下のnoteを参考にしました。

今回はその重回帰分析を用いてp値が0.05を下回った項目のみでつくった予測式を使って新外国人選手がNPBで活躍するのに必要な要素とは何かを考察します。

算出の過程についてはこちらをご覧ください。

予測式

まず重回帰分析によって有意と認められた説明変数で作った予測式がこちらです。

NPBでのwRC+

= 体重(kg)×0.94 +オフスピードボールの被投球割合 ×(-4.39) + 対左右のK%の差の絶対値 ×(-2.96) +93.8

この予測式の当てはまりを示す重決定R2の値は0.34となっています。当てはまりの良さで言えばやや良い程度でしょうか。あまり過信はできませんが。

それぞれの項目で見ていくと体重は重いほど、オフスピードボールの被投球割合は少ないほど、対左右のK%の絶対値は小さいほどNPBでの予測wRC+の値は高くなります。これらの項目について因果関係を考察していきます。

体重

体重は1kg重ければ重いほどNPBでのwRC+が0.94上昇します。因果関係として考えられるのは体重が重いほど長打力のポテンシャルが高い打者、ということではないでしょうか。単純に本塁打/打球や本塁打/打数のような指標で長打力を測ろうとした場合、MLB投手の厳しい攻めや球威、芯をずらすボールの影響でその打者が本来持ってる長打のポテンシャルを発揮させてもらえないという可能性が考えられます。その点、体重なら単純に飛ばす能力のポテンシャルを測れそうです。(長打もないのに体重が重いコーナーポジションの打者がMLBで多くの打席を立たせてもらえないでしょうし)

オフスピードボールの投球割合

オフスピードボールとはチェンジアップやスプリットのような回転数の少ない球種のことです。この投球割合が1%多いとwRC+の予測値は4.39減少します。原因の1つとして考えられるのはオフスピードボールの投球割合は左右打者と疑似相関の関係にあることです。右打者を1、それ以外の打者を0としたダミー変数と相関をとると-0.27と相関があります。このオフスピードボールの投球割合という変数は打者の左右と言う情報を含んでいるのかと思われます。(左右打席のダミー変数を使用した場合、基本的に右打者のがwRC+が15程度高くなります)ただ打者の左右を分けたダミー変数を使った時より重決定の値が高くなるのでこの変数を使用しました。もしかしたらMLB時代にどんな配球をされる打者だったかと言う情報もNPBでの成績を予測するうえで重要なのかもしれません。

対左右のK%の差の絶対値

対左右のK%の差の絶対値とは例えば左投手を相手にした場合K%が20%、右投手を相手にした場合のK%が22%の打者がいたとします。このとき左投手のK%から右投手を相手にした場合のK%の値を引きます。

20% - 22% = -2

ここでは絶対値をとるためマイナスをとります。よってこの打者の対左右のK%の差の絶対値は2です。

絶対値を使う理由としては左右どちらでも対戦成績が偏っている場合に同じ価値として扱うためです。このようにすれば左投手を相手にしたときに2%三振が多い場合も右投手を相手にしたときに2%三振が多い場合も同じ価値として扱えます。

対左右でのK%の差の絶対値が1%高いほど打者のwRC+は2.96減少します。これは左右で対戦成績に偏りがあるような打者は活躍しづらいということを表しています。因果関係として考えられるのはNPBに入団する外国人選手というのは外国人枠という枠を1つ使い即戦力の選手として高い年俸を支払って獲得する選手だということではないでしょうか。貴重な枠と高額な年俸を支払って獲得した選手であるがゆえに相手投手が苦手な利き腕の選手だからといってスタメンから外したり代打を出すといったことは行いづらくしかし相手はその弱点を徹底的に攻めてくるので結果数字が悪くなる、というシナリオではないかと推測しています。

予測式を使って今季の新外国人選手の成績を予測する

新外国人 成績予測

上記の予測式を使って新外国人選手の成績を予測しました。

予測式の当てはまりは0.34程度なのでそこまでアテになるわけではないですが野球未経験者の自分が当てずっぽうで予測するよりはマシかな、という感じです。

実際には過去の成績以外の要素、というのも成績の決定には関わってきます。例えば本人のNPBでのモチベーション、周囲の環境とマッチするか、運(例えば序盤にBABIPが下振れするなどして成績が低くなってしまった結果早めに見切られてしまう等)などが考えられます。過去のデータを使った予測は予測でしかないわけですが選手の成績を予測するのは野球の楽しみの1つでありそのツールの1つとして楽しんでいただければ幸いです。

この記事が気に入ったらサポートをしてみませんか?