WARの改善 - 平均への暗黙の回帰

昨日は、Replacement levelを求める方法を紹介しました。

Sports dataに関して、おそらく最大の混乱の原因は、Observationに含まれるRandom variationの量です。 上記のthreadでは、直近のseasonで半seasonに相当する5回以上の個別化ゲーム(iGames、またはiG)があり、過去3シーズンで15回以上のiGがある選手に焦点を当てました。 なぜそんなことをしたのか。 信号がnoiseを抑制するためには、相当量のdataが必要だからです。 そして、平均約20iGame(Full season2回分)で十分だったのです。

では、どのようにして代替レベルを見つけるのか、その方法を紹介します。前 seasonの成績は確認せず、前 seasonのiGが5以上ある選手に焦点を当てます。 1424人の選手で、インディスの勝率が.200以下の選手は124人います。 彼らの平均勝率は.119でした。

これは彼らの真の才能を表しているのでしょうか? いいえ、まったく違います。 真の才能の一部を表しているが、ランダムなばらつきもある。 これらは必ずしも代替レベル以下の選手ではありません。 必ずしも代替レベル以下の選手で「 play」したわけでもない。 私たちが知っているのは、不運にも.119という levelの statsを記録することになった.350の選手たちだ、ということだけである。 なぜそう言えるのか?

不偏の推定量を探せばわかる事です。 そして、それを探すのに最適なのは、あなたが選択したperformance観測の一部ではない seasonからです。 そして、それを見つける最も簡単な場所は、次の seasonです。 そして次の seasonでは、これらの playerは平均3.6iGames、勝率.382となります。 そしてそれが、彼らの真の才能のレベルを推定することになる。

では、これは何を意味するのでしょうか? .119が代替レベルなのでしょうか? それとも.382なのか? どちらにも問題はありますが、前者は後者よりはるかに大きな問題を抱えています。 次の season、勝率.382の方は、次のシーズンで実際に playした選手だけに限定されるのです。 これが生存率バイアスです。 前年に怪我をした選手は、次のシーズンには良くなっていたかもしれない。 あるいは、本当に悪かった選手は、降板してしまったために、その悪さをアピールする機会がなかった。

その.119で何ができるのか? ここが本当にやっかいなところです。 勝率.119は、幸運よりも不運が多いという観察結果です。 しかし、我々はこれらの選手を、幸運と不運が同量である真の才能レベルである勝率.300と比較したいのです。 .119の選手のWARがマイナスになるのは、必ずしも公平なことなのでしょうか?

次のシーズンのインディーズ勝率の中央値は.275でした。 これが、このグループの真の才能のレベルに関する最良の推定値であろう。 それでもなお、.119をどうするかということが残っている。 代替レベル以下の選手として表現することは可能だろうか。 結局のところ、私たちは彼らの集団としての真の才能レベルは.275だと考えているのでしょう。 それなら、彼らを.119と見なすことはできないだろうか。

だからこそ、1 seasonだけの観測にとらわれすぎないようにしたいのです。 sample sizeを拡大する事で、代替レベルとは何かをより忠実に表現することができるのです。 それは、.300に近い数字になるでしょう。

しかし、.275の真の選手が、たまたま.119レベルの数字を出したことで、.300レベルに対して.119レベルとして評価されるという考えから抜け出せなくなっている。

平均への回帰を明示する以外の選択肢は、代替レベルの変動です。 つまり、.119の選手は、例えば.150の代替レベルと比較される。 そして、.225の選手は、.240の選手と比較されるかもしれません。 そして、.300に達するまで、そのようなことが繰り返されます。 これは暗黙の「平均への回帰」です。

そして、これはBill Jamesが言っている事かもしれません。 彼は実際にRegression Toward the Mean solutionを提案しているのかもしれませんが、それを明示する代わりに(つまり、作業するための事後数を与えるために観測値を調整する)、代わりに観測値を変更しない事に固執し、比較baselineを浮動させます。 もしこれが彼の言っている事なら、私の提案は、両者が同じページに立つためのちょうどいい方法かもしれません。

この記事が気に入ったらサポートをしてみませんか?