見出し画像

WARの解説④ -補足事項-

「WARの大枠の説明」としては前回までの記事でほとんど出来たと思います。この記事ではさらに詳しいところまで解説していく予定です。少しマニアックな内容になるとだけ先にお伝えしておきます。

■「WARの枠組み」の補足

前回の記事で簡単に紹介した部分ではありますが、「WAR」について解説する上で非常に重要になる部分であり、かつ私としてもとても面白く美しい部分であると考えている為、もう少し深く掘り下げていきます。再掲にはなりますが、リプレイスメント・レベルについての考え方を学ぶ過程で参考にした記事を改めて載せておきます。

▼基準を「勝率.294」に設定する

ここまで、WARは「リプレイスメント・レベル」=「代替可能水準」を基準とし、「どれだけ創出得失点を生み出したか」という指標だと説明しました。では「野手」や「投手」のリプレイスメント・レベルは具体的にどれほどの成績を残しているのか?上に載せた記事にも記載されていますが、実はここには綺麗な答えはありません。

著名なセイバーメトリシャンであるTom Tangoは、自身のブログで「野手・先発投手の代替可能水準=勝率.380」「救援投手の代替可能水準=勝率.470」と設定しています。説明を付け加えると「平均的な野手・リリーフ+代替可能水準の先発投手で構成されている球団=勝率.380」といった意味であり、リーグ全体の成績が年度ごとに変化してもこの水準は変わりません。また「野手の勝率.380」「先発投手の勝率.380+リリーフの勝率.470=投手の勝率.410」に「オッズレシオ法」を適応する事で「代替可能水準の球団=勝率約.300」を導き出しています。

リプレイスメント・レベル野手全体で1試合あたり0.120勝失っていると仮定すると、162試合換算で約19.4勝の損失。同じく投手で計算すると約14.6勝。比率を計算すると大体「野手57:投手43」となり、WARは野手と投手の比率をこの数字で分配しています(正確にはサイトによって若干異なりますが詳細は後述)。

Tangoは上記のブログで、リプレイスメント・レベルについて更に深く掘り下げています。当時はALのみDH制度を採用していた為現行のルールと若干異なる部分がありますが、簡潔に説明すると「野手と投手の平均レベルとリプレイスメント・レベルを比較した場合、全体で野手563WAR、投手で446WAR=計1009WARが創出され、リプレイスメント・レベルであるチームの勝率は.292に設定される」というものです。ここからは憶測になりますが「見栄えの問題」で少し調整を加え、勝率を.294に上げることで合計のWARを「1000」に調整し、それを「野手57:投手43」に分配しています。

駆け足の説明になってしまった為イマイチ理解しづらい部分もあるかと思います。あくまでそういう仕組みと内訳になってるんだな程度で。参考までにリプレイスメント・レベルの勝率.294から1000WARを算出する式だけ貼っておきます。

162試合×15(その試合の勝利チーム)=2430勝
162試合×30球団×勝率.294444…=約1430勝
2430−1430=1000WAR
野手:約570WAR 投手:約430WAR

FanGraphs社算出の野手WAR。2020年は短縮シーズン。

▼「基準」は正しく設定されているか?

ここまでの説明で、WARはかなり複雑な仕組みになっていると感じる反面、「かなりざっくりと設定されてないか?」と思った方も多いかもしれません。これらは所謂「代替可能水準=メジャーの控えレベル」のラインにいる選手のWARを集計する事で比較的簡単に検証が可能です。

FanGraphs元編集長でもあるDave Cameron氏は、2013年に寄稿した上の記事で「過去2シーズンで100打席以上出場し、そのオフにマイナー契約となった or 繰り返しウェーバー公示となった野手=代替可能水準である24選手」を抽出し集計したところ、10000打席以上で-0.7WAR=1シーズン約600打席とすると-0.04WAR、想定していた「代替可能水準」とほぼ一致すると記述しています。

完全に一致しているわけではありませんが、WARが「基準からの相対評価」である以上「各選手の貢献度が全体の内何割を占めるか」に変わりはなく、よほどズレた基準を設定しない限り特に問題はありません。指摘するとしたら「先発投手とリリーフのリプレイスメント・レベルの設定が大幅に異なる場合、正しい比較が出来ない(それぞれ難易度に差がある為)」「各サイトによって基準が異なる場合、同等のスケールで比較することが困難」あたりが挙げられますが、この2点について言及されている記事がありますのでリンクを貼っておきます。

特に2つ目の記事はとても興味深い内容になっています。2013年3月にアップデートされるまで、FanGraphs社はリプレイスメント・レベルを.265に、Baseball Referenceは.320に設定していたことにより同一の選手でも大きく差が開いてしまう点が指摘されており、それらを統一した際の記事になっています。

こちらはリプレイスメント・レベルが統一されるまでの、WARの信頼度や欠点について議論されているスレッドです。「The important thing to remember about WAR is that it's not really a "stat." It's a framework.(WARは統計ではなく、あくまで枠組みに過ぎない)」といった基本的な話から説明されており、WARの歴史を知る為にもぜひ読んで頂きたいです。

上の記事では「平均を基準にすること」の問題について、Tangoが簡潔に解説しています。

▼「fWAR=57:43」「rWAR=59:41」

「1000WAR」を分配する上で、rWARとfWAR で異なる点です。 fWARでは、上に載せたTangoの記事において、ざっくりと野手、先発投手、救援投手でリプレイスメント・レベルを設定した上で生じた比率をそのまま「野手57:投手43」に分配している一方、rWARでは「過去数年間フリー・エージェントとなった選手の給与の比率」から「野手59:投手41」の比率を算出しています。

投手と野手の責任比率」という重要な部分において、fWARの「リプレイスメント・レベルを定めた上で数学的なアプローチを行い算出する」という手法も、rWARの「実際のリプレイスメント・レベルの比率から算出する」という手法も共に合理的なものだと思いますが、いずれにせよこの部分は改善の余地がある部分だと感じます(現状そういった比率にするしかないかなあ、という感想です)。

WARは投手を過小評価している」という意見はちらほら見かけますが、当然ながら自チームの守備責任が全て投手にあるわけではなく、それらを先発投手5、6人+救援投手+@で分割していることを考えると、毎試合出場し続ける野手に比べてひとりの投手が負う責任はどうしても小さくなる、という傾向はどちらのWARにも共通していると言えます。

数年前のものではありますが、興味深い記事があったのでリンクを貼っておきます。2011年以降の各球団の給与比率を見ると、WARの比率以上に投手に多く給与が支払われる傾向がある一方、WARが設定した「投手40〜45%」に近い比率で支払いをしている球団ほど勝率が高い傾向にあり、それを上回ると勝率が低下していく、という面白いデータです。WARは各ポジションの希少性・価値を完全に反映した指標ではない為実際の給与との比率が異なる事実には納得が行きますが、強いチームほど「無駄なく、バランス良くチーム編成を行えている可能性が高い」とも言えるでしょう。

■「守備位置補正」の仕組み

▼中立的な評価を行う為に

WARの議論の中で、頻繁に「欠陥」と指摘される点について解説します。ごちゃごちゃした数字の話をする前に、なぜ守備位置補正が必要かを肌感覚で理解出来そうなツイートを八九余談氏が投稿されていたので下にペーストします。

この記事まで辿りついてる野球好きの方なら感覚で理解出来ると思いますが、上記の数値には「各ポジションの難易度」や「人材価値(30本塁打を打てる捕手と、同等の数字を残せる指名打者、どちらの方が希少か?と考えると分かりやすいと思います)」などが考慮されていません。そこで「各ポジションの打撃成績」の比較であったり、「複数ポジションを守った同一選手の、ポジション毎の守備成績」の比較等で上に記した「考慮するべき部分」を数値化し、成績に反映させることで異なるポジションの選手同士の比較を可能にしています。

WARについて言及されている記事を漁っていると、稀に「WARは守備位置補正が大きいポジション(ショートやセンター等)を守っているだけで上がっていくおかしな指標だ」という指摘が散見されますが、補正を下回らないレベルでそのポジションをこなしている人材には確かな価値があり、ポジション毎の成績の比較で差を数値化している以上、仮に他のポジションに移動した場合それ相応の増減が「見込まれる」為、多少強引ではありますが理に適った計算方法であると言えるでしょう。

現状、守備指標として扱われているUZR+OAAやDRSが「各ポジションの平均」を基準として算出されている為、その数値を異なるポジションの比較に用いることは不可能です(稀に別ポジションの比較にUZRやDRSを持ち出している頓珍漢な記事を見かけますが)。ポジション毎の難易度等を考慮した補正を加えることで、中立的に「創出得失点」を比較できる仕組みになっています。

▼実際の数値と算出方法

まず、r、fそれぞれに適応されている守備位置補正の値を貼っておきます。

上で軽く触れましたが、両者の数値に若干の差が生じているのは「算出方法の違い」であり、簡単に言うと、rWARは「ポジション毎の打撃成績の差」から、fWARは「複数ポジションを守った選手の、ポジション毎の守備成績の差」から守備位置補正の数値を算出しています。

興味深いのは、多少数値に差が生じていても「ポジション別の補正の順序」は一緒だという点。また、数値の正確さは置いといて、我々のような所謂「野球ファン」の「捕手でこれくらい打てれば及第点だな」「DHにはこれくらいの成績は残してもらわないとな」といったぼんやりとした感覚にも近い気がします。その感覚の差を平均=0と比較し、各ポジションに加算・減算されるのがこの数値です。

算出方法がかなり複雑になる為、Tangoが「守備成績から算出した過程」のリンク(Baseball Concrete様によって全てのリンクがまとめられていたのでそちらで代用します)、Baseball Reference社の「打撃成績からの算出と年度毎の推移」のリンクを下に貼ります。

また、これらの更なる改良案として、Jeff Zimmerman氏の「打撃成績、守備成績の両者を考慮した守備位置補正」のリンクも追記しておきます。

「現状そういった計算を取らざるを得ない」といった要素が強い部分ではあると感じていますが、それと同時に「異なるポジションの比較を可能にする」というWARの最大の特徴でもあり、面白い部分でもあると思っています。もし自分の感覚と大きく異なり、それによって「WARは欠陥だ」と感じた方がいたら、自分なりの方法で新しい補正の値を算出してみるのも面白いかもしれません。

■「パークファクター」の仕組み

▼環境の違いを考慮する

多くの野球ファンはご存知かと思いますが、野球場というのはそれぞれ形状や立地が異なります。また、それらは「得点」や「HR」といった要素や、「右打者なのか、左打者なのか」と言った部分にも大きく関わってくることがデータでも判明しています。MLBやデータに詳しくなくとも「神宮球場はHRが出やすい」「バンテリンドームは投手に有利」という話を耳にしたり、肌感覚でも理解している方は多いと思います。

ここまで何度も述べていますが、WARの特徴は「選手を中立的に評価する」という点です。打者で言えば「ランナーが塁上に何人いるのか、点差はいくつあるのか」といった状況を全て考慮せず、あくまでその選手だけが創出した得点を適切に算出し、投手で言えば「味方の打線が何点取っているのか」という「投手自身では左右出来ない部分」を無視します(投手の「勝利数」を重視しない理由が分かると思います)。

また、それらの創出得失点を算出する上で「選手が置かれた状況」を加味し、反映する必要があります。「捕手」と「指名打者」、2名の選手が平均レベルの成績を残したとしてもそれらの貢献度は同等ではない=守備位置補正によってポジション毎の貢献をWARに含めるのと同じように、「神宮球場で放った30HR」と「バンテリンドームで放った30HR」もそれぞれ環境の違いを考慮し、補正を加えて中立的に評価する必要があります。これが「パークファクター」の基本的な考え方です。

参考になりそうなリンクは以下。

▼算出方法

基本的に「対象の球場」と「その他の球場」の得失点差から算出する、という点はどの媒体でも変わりありません。ただ、サイト毎に考慮する部分が若干異なり、それによって数値も異なっています(純粋に得点ベースで補正値を算出するBaseball Reference、FIPベースで算出しているFangraphs、気温や風向を考慮して更に高度なアプローチを行っているBaseball Savant等)。

正直私自身一番曖昧になっている部分なので、実際に扱われている補正値が載ったリンクをそのまま貼っておきます。もう少し深堀り出来たら別の記事にまとめるかも。

簡単に特徴と注意点だけ。

・平均を100とし、それを下回る場合は投手有利、上回る場合は打者有利。
・1年では変動が大きい為、数年分のサンプルを取る。Fangraphsは5年、Baseball Referenceは3年など。但しBaseball Prospectus算出の打撃指標DRC+のように対象を1年としている場合も。
・「球場が大きい=投手有利」という訳ではない。本塁打が少なくても三塁打が出やすい球場があったり、四球が発生しやすい球場もある。その為上記リンクには「得点」だけでなく各イベントの補正が算出されている。

どの計算でも間違っていることはありませんが、変動が大きくそれによってWARにも少なからず影響を及ぼしている要素である為、今後更に研究が進んでいく部分だとは思います。また、フォロワーのmaison様がStatcastデータを利用し、各イベントに重み付けを行って新たに算出したFIPPFを投稿していたのでそちらも参考になるかと思います。個人的に「近いシーズンから順に加重平均を取る」の部分が面白いと思ったんですがこれって一般的なのでしょうか。

■まとめ

あくまで自分用のメモなのでかなりごちゃごちゃした記事になってしまったかと思いますが「野手:投手の配分比率」をはじめ、日本語で言及された記事が見当たらなかった(少なくとも自分の探した範囲では)点に触れられたという意味では満足しています。

手遅れ感もありますが各項目でもっと詳細に書ける気はするので、その内「守備位置補正」「パークファクター」あたりはまた単体で書くかもしれません。

また、この記事で私が曖昧に書いている部分(現状そういった計算をするしかない、等の表現)こそ、WARが今後更にアップデートできる部分だとも思っています。今のところ有識者に頼りっぱなしではありますが、いつかはmaisonさんのように自分で指標を考案していきたいなとも考えています。純粋に勘違いしている部分もある気がするので気付いた方はぜひご教授ください。


この記事が参加している募集

野球が好き

この記事が気に入ったらサポートをしてみませんか?