見出し画像

WHIPで投手の能力を計ることはできるのか?

 先日怪文書アドカレにおいてとどくろくんが書いた野球分析記事がかなり面白かったので紹介させていただきます。

 ここではOPSに盗塁の要素を加えたeSLG(extended slugging percentage)、それをもとに計算されたOPeS(On-base plus eSLG)という指標を作りその数字のバラツキを数学的に分析しNPBの野手の傾向を掴むというような内容でありました。

 個人的に今ライフワークとして今までの人生で触れてこなかった投手の評価という部分に片足を突っ込み始めていたことから今までの防御率などといったシンプルだが問題のある指標ではなくシンプルかつそれなりの精度が出せる投手評価システムを作ろうという考えに至り、投手の指標の中でいろいろ眺めていてかなり簡単に計算できる指標であるWHIP(Walks plus Hits per Inning Pitched、投球回あたり与四球・被安打数合計)をベースとしてこれを投手評価に使えないかという考えに至りました。

 なので今回その辺について書いていきますが、この方法を考えてからインターネットを調べたところすでに先行研究がありましたのでそちらの方が正確かもしれません。そちらもご覧ください。

1.WHIPとは

 WHIPとは(与四球+被安打)÷投球回で求められる指標で、簡単に言えば1イニング当たり何人のランナーを出すのかという指標です。これかなり感覚的に投手のイメージを抱くことができる指標で、WHIPが1以下だと1イニングあたり一人も出さないということで、つまりそれだけ支配的な投球をしていたというイメージがわきやすいのではないでしょうか。逆に言えばWHIPが1.5を超えてるピッチャーなんかはランナーを出しまくっているというところでいわゆる劇場型のイメージが湧きやすいかと思われます。
 つまりWHIPは計算が簡単にもかかわらず投手のイメージをある程度ざっくりと掴むにあたっては優秀な指標であると言えます。実際MLB(野球)やCPBL(台湾)などでは公式記録として使われています(逆にNPBはWHIPすら公開しないとは何をしているというのか)。

 しかしWHIPは現代の野球において指標としては無能であるという風潮は非常に強まりつつあります。

WHIPは投手がコントロールしにくいとされるBABIPに大きく依存している指標であるため、投球内容を適切に表しているとは言えない。これらの理由からWHIPに批判的な意見も多く、大手データサイトのFanGraphsでは、「WHIPは愚かな指標である。一部の人々はVORPとtERAと並んで、目新しいマネーボールスタットとして参照するのが好きだが、WHIPはプレイヤーのスキルをあらわすものではない。勿論ランナーを出さないのは良い投手である傾向があるが、それは絶対ではない。WHIPは他の多くの統計の副産物であり、投手を評価する際に基本的に無視されるべきである」と、投手評価に使用することを全面否定している。

WHIP Wikipedia

 簡単に言えばヒットをどれだけ打たれるかというのは守備や運に影響される部分が非常に大きいわけです。守備が優秀なチームで投げる投手はヒットを打たれにくいし、どんなエースでも守備がその辺の草野球のおっさんではヒットを打たれまくるのは回避できないわけです。
 そして統計学的に「凡打を打たせる技術」というものは否定されています。つまり「巧みなピッチングによって野手のいる方向へ打たせる」というような技術は存在しません。統計的にフェアゾーン内に飛んだ打球は3割程度はヒットになるものであって、一年単位でインプレー打率が3割以下の投手は打たせて取る技術があるわけではなくただ偶然アウトになっているだけとセイバーメトリクスでは評価されています。多少の数字のムラがあっても通算成績で見ればBABIPは3割程度に収束するものなのです。
 運や守備の要素を考えずに評価しているWHIPは必ずしも投手の実力を反映しているとは言えない、WHIPベースで考えようというのは適切ではないというところは重要なポイントとしてお伝えしておきます。
 しかしそのうえでその計算の簡便さを利用して投手評価に用いるのは特に指標が枯渇しているこの日本において野球ファンとしてはいろいろいじり甲斐もあるのではないかと思った所存です。

2.WHIPは何を評価しているのか

 WHIPとはどれだけ支配的な投球をしていたか、という評価に使える指標です。WHIPが優秀であるということはランナーを出さないということであり、打たれもしなければフォアボールも出さないという究極の投手ということになります。
 一般的にランナーを出せば出すほど失点のリスクは高まるわけですからランナーを出さない投手ということはそれだけ失点リスクを抑えている、つまりそこを詰めていけば平均的な投手と比較してどれだけ失点リスクを抑えたのか、という評価軸にもっていくことが可能なのではないか、ということです。

2.1.WHIPを得点ベースに換算してみる

 ここで問題になるのが出塁を1つ許すたびに何点分の失点リスクがあるのかということです。出塁と言ってもフォアボールもあればホームランもあります。
 投手というのは様々な打者と対戦するものです。強打者とばかり対戦する投手というのは基本的にはいません。よって平均的な打者、ありていに言えば「そこら辺のプロ野球選手」と対戦するということを考えます。リーグ全体の打撃成績を集計し、ヒットやホームラン、四球などがどれぐらいの割合で発生するのかを考えます。

 さらに打撃結果ごとの得点価値を加えて出塁一つあたりの加重平均を求めます。
 簡単に言えば一個40円のみかんを100個、一個75円のリンゴを25個、一個100円の桃を3個、一個140円のマンゴーを13個、一個30円の柿を50個すべて同じ箱に入れた時、ランダムに一個果物を取り出した場合の果物の値段の期待値を計算するというような作業です。つまりこの問題においては
(40×100+75×25+100×3+140×13+30×50)/(100+25+3+13+50)
 これを計算すれば果物の価格の加重平均を求めることができるというわけです。結果は49.7、つまり完全ランダムに果物をピックした場合の価格の期待値は50円ほどということです。

 同じように出塁について加重平均を取った結果出塁一つ当たりの得点価値は0.51という数字が出てきました。つまりこれはWHIPが1上がれば0.51点分失点のリスクを増やしたということになります。

2.2.WHIPベースの防御率、WERA

 リーグの平均WHIPと当該投手のWHIPを比較することによって平均的な投手よりもどれだけ失点リスクを減らしたかを計算していけばいいのです。
 たとえば平均的な投手のWHIPが2.00であるとして当該投手のWHIPが1であるとすると1イニングにつき0.51点失点を減らしていると考えられます。これを9イニングあたりにとして計算すると9×0.51×(1-2)=-4.59となります。つまり9イニング当たり約4.6点失点を減らしたということです。

一般化すれば
9×0.51×(当該投手のWHIP-リーグ平均WHIP)=失点抑止
近似値を取って
4.6×(当該投手のWHIP-リーグ平均WHIP)=失点抑止

 平均的な投手は平均的なWHIPで平均的な防御率となるということを考慮すれば上記の式にリーグ平均防御率を足せばWHIPから求められる疑似的な防御率を計算することが可能となります。この疑似的な防御率をWERA(WHIP Earned Run Average)と呼称することとします。

WERA=4.6×(当該投手のWHIP-リーグ平均WHIP)+リーグ平均防御率

 例えば涌井投手(現中日)のWERAについて計算してみると下記のような数字になります。

 基本的には防御率に近い数字にはなってきますが残塁率(LOB%)が平均から乖離しているシーズンにおいてはWERAと防御率(ERA)の数字の乖離が大きくなってきます。残塁率については投手にコントロールできる指標ではないのでそこの運要素を排除することができ、防御率を多少は改善することができたことになります。

2.3.WERAベースのWAR、WWAR

 WERAを計算することができるということはあとはこれを好きなように使うだけです。

 例えばWAR(Wins Above Replacement)という指標があります。これは平均的な選手と比較してその選手がどれだけチームに勝利をもたらしたかを表す指標で、プレーのすべてを得点に換算し求めることができます。
 先ほどWERAを求めましたが、WERAをベースにWARの計算をすることも可能です。fangraphsではWARの計算についてFIP(Fielding Independent Pitching)をベースに計算していますのでfWARの計算方法をFIPからWERAに置き換えるだけでWWARの計算は可能です。WARの計算方法について書き始めると非常に長くなるのでここで書くことは避けますが、比較的簡単に投手のWARを計算することが可能になります。

 先ほどの涌井投手の場合について考えると以下のような結果になります。

 涌井投手のWWARは過去6年間では2020年が最も優秀という数字になります。この年楽天移籍1年目の涌井投手は130イニングで防御率3.60を記録し11勝で最多勝に輝きました。WERAでは2020年の涌井投手は2.89と実際の防御率よりも高い評価を受けており、出塁阻止能力という部分では光っていたという評価ができます。

3.wWHIP(weighted WHIP)

 投手のスタッツを評価するにあたって最大の問題となるのが被本塁打です。被本塁打は失点に強く関わっており無視することはできない要素ですがWHIPではどんな出塁も等しく1としてカウントしている結果被本塁打の要素がかなり軽くなっています。
 逆に四死球による出塁はヒットによる出塁よりも価値が低いです(ヒットの中には長打も含まれるため)。これらの要素を考慮しそれぞれの要素に適正な重みづけを行ったWHIP、つまりwWHIPで投手を評価するとよりその要素は正確性を増します。計算は多少煩雑になるもののこれは必要な改良です。
 四球は一般的な出塁の56%程度、死球は60%程度の価値しかありません。一方本塁打は270%もの高い価値を持っています。これを等しくすべて1としてカウントするのは多少乱暴であるということです。

wWHIP=(0.56×四球+0.60×死球+被安打+1.70×被本塁打)÷投球回

 あとはさっきのWHIPと同じ作業を行えば防御率ベースの数字に変換することが可能になります。

wWERA=4.6×(wWHIP-lgwWHIP)+lgERA
※lgはリーグ平均値

 再び涌井投手に関して考えてみると

 2020年の涌井投手はWERAでは非常に評価が高いシーズンでしたがwWERAでは評価が下がる結果になりました。これはひとえに被本塁打の多さが原因で、むしろ2022年のほうが被本塁打を少なく抑えたということで最も優秀な数字が出ることとなりました。

 さらにWERAと同様の処理をすることによりwWWARを求めることが可能になります。

 2018年の涌井投手がWAR2.28を記録し2020年の数字に肉薄しています。2018年の涌井投手は防御率3.70でしたが150イニングを投げるなどしており被本塁打回避などで数字を伸ばした結果wWWARを伸ばした結果になっています。
 煩雑な指標というのは何が影響して数字が良化しているかというのが往々にしてわかりにくいのですがWHIPやwWHIPはその点においてわかりやすい指標(故にノイズも多いのですが)なのが強みではあります。

4.結論

 まあ結局のところこれはすべてWHIPをベースに失点を予測しているだけのものでしかないのでどこまでの価値があるかはわかりにくいところではあります。しかしここまでシンプルな予測でもかなりの精度が出せるというのが野球の面白さでもあります。
 とくにWARの計算をするにあたっては何を評価軸にするかというのは難しい問題で、実際計算の煩雑な指標もたくさんあるわけで、いちいちそんなもん計算してられないというのは多くの野球ファンが持っている感情だと思います。その点においてはこのWERAやwWERAは優秀だと言えるでしょう。

 実際には計算が煩雑な指標ほど正確性が増しますしそういう指標の裏側を覗いて仕組みを理解するのは非常に面白い作業なのですが、そういったセイバーメトリクスの入り口の指標としてこういった指標から始めてみるのは面白いんじゃないでしょうか。

サポートしてくださると非常にありがたいです。