セイバー101:Ultimate Zone Rating

セイバーメトリクス--高度な数学と統計学を駆使した野球の研究--で最も注目されているのは、守備の数値化だろう。 これも新しい魅力ではない。 110年以上前、一人の単純なjournalistが、どの失点が守備に、どの失点が相手の攻撃に加算されるべきかを数値化しようと試みた。 その人物はヘンリー・チャドウィックであり、彼が新たに生み出した方法? And RUN average。 チャドウィックは近代野球統計学のゴッドファーザーと言われている。 結局、彼は今日私たちが使っているボックススコアを発明した(ただし、記録されている列は違うが、形式は同じ)。

それから1世紀が経った今も、私たちはそのことわざ通りの戦いを続けている。 ミッチェル・リヒトマンという男が登場した。 彼の創作は、チャドウィックが考え出したものよりもほんの少し複雑だ。 Internetの熱狂と、昨冬Fangraphsを襲ったWins Above Replacementブームにより、セイバーメトリクス・コミュニティの間で守備を評価することが流行となり、アルティメット・ゾーン・レーティング(UZR)はこの新たな関心の最大の受益者となった。 しかし、UZRは一般に公開されている統計の中で最も引用を誤り、誤解されている統計でもある。

ここでは、UZRに対する誤解を解き、その方法論に光を当て、UZRを使うべき理由と方法を説明する。

アルティメット・ゾーン・レーティングとは何か?
最も単純に言えば 選手が守備面でチームにどれだけ貢献したかを評価する統計である。 ポジションの平均より上か下かで評価される。 私が目にしたことのひとつは、異なるポジションを比較する人々だ。 ホームランを打つのがクアーズ・フィールドとコメリカ・パークで同じではないように、ショートの平均と右翼の平均は同じではない。

どのように機能するのか?

正直複雑だ。 これは一般ファンがエクセルのspreadsheetでその場で計算できるものではない。 可能だが、その価値以上に多くの労力がかかる。 だからこそ、セイバーメトリクスのコミュニティが重要なのだ。 ミッチェル・リヒトマン(『Fangraphs』や『The Hardball Times』などで言及されているのを見かけると、MGLと呼ばれている)は、すでに私たちのために力仕事をしてくれている。

UZRはfieldをゾーンと呼ばれる78の異なるsliceに分割する。 ご心配なく、UZRの計算式で使われるのは64個だけだ。 各ゾーンでのインプレーの平均球数を計算し、次に各ゾーンでのプレーの記録率を計算する。 これによって、そのポジションのベースライン平均が得られる。 さて、あなたはこれを個人単位で行い、平均的な野手のプレーと比較して評価する。 リーグ平均と比べ、自分のzoneで記録されたプレー数が少ない選手は、Zone ratingがマイナスとなる。 また、そのポジションの平均的な守備者よりも多くのアウトを記録していれば、ゾーン評価はプラスになる。

それを、そのポジションが担当するすべてのゾーンについて行う。

しかし、これはプロセスのほんの一部に過ぎない。 そして、未調整のUZRを調整する。 なぜなら、上述したように、その選手の本当の才能を理解するためには、文脈を理解する必要があるからだ。 投手陣によっては、より多くのボールを野手に与えることもある。 例えば、ブランドン・インジは、タイガースが左投手ばかりのスタッフであれば、彼へのゴロが増えるだろう。 もしスタッフが右投手で埋め尽くされていたら、逆のことが言える。

何を調整する必要があるのか? 球場(外野手はなおさら)、投手と打者の手の大きさ、アウトの数、走者の数、走者がどの塁にいるか、打球のスピード。 ミゲル・カブレラが右投手からコメリカ・パークの左中間に放った長打と、デビッド・エクスタインが右投手からペトコ・パークの左中間に放った長打は同じではないだろう。

未調整のUZRに大きな影響を与えるこれらの要素をすべて調整したら、インターネット上で誤用され、誤引用される可能性のある、実行可能な防御率の指標ができたことになる!

どう使えばいいのか?

覚えておくべき最大のポイントは、サンプルサイズ、サンプルサイズ、サンプルサイズ、そしてサンプルサイズ(カートのために4つ目)である(編集部注:マイクによる記事はこれが最初と同様、最後になるのだろうか)。 UZRは年ごとに、ましてや月ごとに大きく変動しやすい。 ディフェンスは、データソースの関係で、すべての高度な統計の中でまだ最も不透明です。 UZRを使用する際のいくつかの経験則:

1年間のUZRデータは、約50~55試合分の攻撃と同等である。4月1日から6月までの試合だけでミゲル・カブレラのプレートでの才能を判断するだろうか? 私はそうしないし、あなたもそうだろう(そうであってほしい)。 だから守備ではやらない方がいい。 個人的には、ある選手のUZRデータが3年分あるなら、4年分あった方がいい。 UZRのデータが4年分あるなら、むしろ5年分あった方がいい。 私は十分とは思えない。
1年分の守備データは、少なくとも1200イニング分に相当。
150試合あたりのUZR(UZR/150:Fangraphsの選手ページ)はできるだけ使わない。 誤解を招きすぎる。
選手Aがある年は-10、翌年は+10、翌々年は+0だった場合、彼は平均的野手の可能性が高い。 年ごとのデータに大きな変動があるのは珍しくないが、常に平均値(できれば加重平均)を使い、それを保守的に使うべきだ。
可能であれば、複数の守備システム(UZR、ジョン・デュワンのプラス/マイナスシステムなど)を使って選手を評価する。

システムの欠陥

私はこのことを断言するつもりはない: 私は野球の統計学を固く信じている。 私も甘くはない。 UZRには欠点がある。 しかし、それは方法論によるものではなく--この種の数値化はどのように扱われるべきか--データソースによるものだ。

誰もが納得できるような統一されたシステムはまだない。 二塁打は二塁打だから、打率については誰もが同意できる。 しかし、二塁手がブーイングしたハードチョッパーは、そうでない限りエラーになる。

UZRには、ジョン・デュワンのプラス/マイナス・システムのような、他の高度な守備システムと大きく食い違う選手がいる。 Alex RemingtonがBig League Stewで指摘しているように、2008年と2009年のアダム・ダンのUZRによる守備力は-64点である。 しかし、デュワンのプラス・マイナスのデータでは、彼は-45となっている。 それでもひどいが、20のスイングでもあり、野球選手としての総価値に大きく影響する。 UZRとDewanのシステムはどちらも同じデータソースを使用しており、それは人々が試合を見てプレーに関する数値を記録することである。 それはデータソースに多くの主観を残し、ヒューマンエラーとバイアスは最終的に忍び寄るだろう。 HITf/xが出るまで(今年の夏を期待している)、これが我々のできる最善の方法である。

使うべき理由
これは、利用可能な守備システムの中で最高のものだと私は思う。 そして、Fangraphsを定期的に閲覧している人もいるかもしれない。 私たちが取得できる最高のデータを使い、ディフェンダーの視点からプレーに影響を与えるすべてのものを調整する。 しかし、私にとって最も重要なのは、これがパズルの非常に重要なピースであるということだ。

野球には3局面があることは誰もが知っている: オフェンス、ディフェンス、ピッチング。 個人レベルでは、さらに多くある: オフェンス、ディフェンス、走塁。 UZRは、選手の真の才能レベルを理解するために必要なパズルの3分の1。 結局、100年以上前にヘンリー・チャドウィックが打者と野手にどの得点が加算されるべきかを分けようとした時、それが動き出したのではなかったか? 私たちはその聖火を運んでいるだけなのだ。

リソース
UZRについては多く書かれているが、(方法について詳しく読みたいのであれば)2つの大きな情報がこことここにある。 アレックス・レミントンの記事は、私がこれを書くための素晴らしい出発点だった。

Fangraphsは、UZRのニーズに対するすべての治療法を提供している。

この記事が気に入ったらサポートをしてみませんか?