過去のERAが過去のFIPよりも将来のERAをより予測するようになるのはいつですか?

要約

ご存知のように、WARの中核指標に、Fangraphs(fWAR)はFIP、Reference(rWAR)はERA(より正確はRA/9)を用いている。
私は、投手はFIPの方が1 seasonを正確に表し、ERAやRA/9の方がcareerを正確に表すという前提で進めてきた。そして、両者が等しく意味を持つのは、5〜8 season程度ではないかと推測しています。1seasonを200IPと考えると、9イニング試合が約22回。で、5-8 seasonは110試合から176試合。

だから、1~3seasonだとfWAR75%、rWAR25%、10season以上だとrWAR75%、fWAR25%という重み付けをしたらどうかと、私は考えています。そのようなものです。そして、あくまでも推測ですが。

なぜERAがFIPに取って代わると思うのかの理由

FIPはSO、BB、HBP、HR以外を完全に無視しているので、最終的には70%の確率でBall-in parkingが発生した欠落したものが小さなsample sizeのnoiseから抜け出す信号として作用するのは当然。大きな問題だ。最終的に、投手のBABIPは、FIPのように完全に無視するのではなく、重要視され始める。他にも出塁率に関わる小さな事柄がたくさん。SB、CS、PK、BK、WP、PB。 また、投手が試合中にhitをばらまくか、1イニングにhitを集中させるか、eventの順序もあります。

ビル・ジェームスの古い記事に、無関係の問題(ムッシーナとホフマンの殿堂入り)で、まさにこのテーマを論じていた。彼は、ERAが捉えているもの、FIPが無視しているものを全て実際に指摘しています。

関連する部分を引用させていただきます。

開始====================================

... WARを計算する人の中には、(これも誰が何をしているか定かではありませんが)実際に許した失点ではなく、その投手個人が周辺数値から予想される失点数を計算式で推定して価値を計算している人もいるかもしれません。トレバー・ホフマンのcareerERAは2.87だが、奪三振、与四球、被本塁打に基づくFIP(Fielder Independent Pitching)は3.08、一方、マイク・ザ・ムースはcareer ERA3.68だが、その周辺数値に基づくFIPでは3.57である。

ここでもまた、疑問の残る調整。投手は、三振や四球、本塁打、安打を与える以外にも、ERAに何らかの影響を与える事をたくさんしています。

また
a) 走者をうまく抑える、あるいは抑える事ができない。
b) runnerを選ぶ。
c) 自分の positionを守る。
d) wild pitchを投げる
e) ground ballを誘う。
f) 状況に応じた投球を一定水準で行う。
SEASON dataを把握する場合、ERAとFIPの乖離は、おそらく投手がControlできないrandomな要因がほとんどであり、ERAよりもFIPを優先すべきなのだろう。しかし、数百イニングに及ぶcareerの記録を扱う場合、つまりここではcareer記録を扱う場合、ERAとFIPの不一致は上記の(a)〜(f)の要因によって生じる可能性が高く、その場合は実際のERAがより有益な数値である事はほぼ間違いないでしょう。より洗練されたsabermetrics分析では、小さなdata群を扱う場合はFIPに依存し、個々の投手のイニング数が多い場合は実際のERAに依存する。
======== 終了

これはまさに私の見解と一致する。まあ、今日まではね。ビルと私、そしておそらく何百人もの皆さんが、この件に関して同じ直感を持っているでしょう。ある時点で、本当の野球の事が重要になり始める。その点を見極めるのがセイバリストとしての仕事だ。ビルは、数百イニングという斜め上の言及以外に、FIPよりERAが優先されるスワップがいつ起こるかについて、推測はしていない。しかし、概念的には、彼と私は一致しています。まあ、今日まで言ってきたようにね。

研究内容

1998年から2021年まで全投手について、これまでのcareerERAとcareerFIP、アウト数を1試合ごとに質問をした。

例えば、2008年5月30日の時点で、ジャスティン・バーランダーは76試合に登板している。その時点で、彼は1422outを記録し、209ERを許し、現在までのERAは3.97である。その後、彼は8067OUTを記録し、3.11のERAのための930失点。バーランダーは2021年まで454試合あるので、私がバーランダーに対して持っているこのような答えの数。これを1998年以降の全投手について繰り返した。

この5月30日の試合では、これまでのcareerで1422個のOUTをとっているので、それを27で割って1試合あたりのOUT数に換算しています。すると、9イニング×52試合分となる。つまり、これまでの52試合では、ERA3.97。この先行52試合には346人の投手が含まれる。この投手たちのERAと残りのcareer ERAの相関を調べると、r=0.35。さらに、FIPとcareer通算ERAを比較すると、r=0.47となる。結論は?9イニングの試合が52試合ある場合、これまでのERAよりも、FIPの方が残りのcareer ERAを決定する上で有益だとわかる。これは、2~3 seasonに相当するため、驚く事ではありません。

そこで、これを53、54...と繰り返してみると、それなりに。137試合までは、将来ERAは、常に現在FIPの方が現在ERAよりも高い相関を持つ。137試合は私の予想の範囲内なので、かなり安心した。ERAが入れ替わるpointなのですね?いいえ、そうではありません。実は138試合から173試合まで、一進一退を繰り返し、この間のERAとFIPは、同じように今後の参考になる。ERAが優位に立つのは、その前の174試合(およそ8〜9 season)を見た時だけ。まあ、185試合までは引き継がれる。それ以降は、再びFIPが支配する。

結論

保守的に考えて、138試合目から引き分け。つまり、9イニングの先行試合が138試合 1242IPがERAとFIPが同じくらい参考になるpointで、どれだけ情報が増えてもそのまま。いずれ入れ替わりが起こるというのは私の勘違い。そんな事はありません。FIPが好まれるのは、1 seasonから数 season。そして、FIPとERAが同等に好まれるのは、7 season以上ある時だけ。

ビル・ジェームスが持ち出した点は、合理的であると同時に、私が過去20年間それを信じてきたのと同様に、まあ、この特別な証拠はsupportするものではない。Aspiring Saberistsがここで何ができるかを見るのが楽しみ。

FIPは初期に大きなリードを取り、長年にわたって強く維持し、FIPとERAは基本的に互角になり、そのままの状態を保っています。

追記

FIPは記述的な統計であり、予測指標ではない事を再確認する必要。 FIPは実データを使用し、単純に重み付けしてscalingしているだけ。
様々な事象(single、double、triple、home run)に重みをつけ、それ以外(WALK、 hitbatter、STEAL、Wild pitchなど)を無視するSLGと何ら変わりはありません。
SLGは、それ以外が重要でないと言っているのではなく、 単にやろうとしている事のためには必要ないと言っている。
OBPは、四球とHRのImpactが同等だと主張しているのではなく、塁に出るという測定目的においては同等であると言っているに過ぎません。

つまり、FIPは投球の一面を表現している。

そして、上記研究から、ERAはrandom変動を含みすぎている事が分かる。
もしBall in Park hit、SB、WP、DPなどを含めたいならば、ERA以外の指標に含め、ERA本来のImpactを妨げている「random変動」の原因を突き止めましょう。
私の推測では、事象の順序が主で、おそらく次がBall-in-parkのHITでしょう。

考慮すべき事の1つは、FIPが球場要因を完全に考慮していない
FIPは、特定球場のHR、BB、K率の球場主導要素を説明しているが、これらの eventがその特定球場で失点する方法を必ずしも説明していない。
そのため、FIPとERAの間には、環境要因に基づく予想される差が厳密に存在する。極端なpitchers parkでは、一般的にFIPよりもERAが低くなり、逆もまた然り。
このため、球場や天候を調整せずにERA-FIPを正確に計算し、情報を得ようとするのは、(どのような期間であれ)良い考えとは言えない。(例外は、同じようなscheduleで登板したチームメイトの場合だ)。
FIPのsimpleさの魅力は理解していますが、特定pitcherの実際ERAと比較すると、SequencingやBABIP以上が欠けています。

解釈するのが難しい事の1つは、従属変数が絶えず変化しています。既にpitchingされている試合のsampleが増えるにつれて、残りのゲームのsampleは縮小しています。したがって、pitcherの才能の評価がより正確になるにつれて、彼の後期 careerの才能の評価は精度が低下します。
さらに、老化の合併症があります。初期の頃は、prime/late career依存変数を予測していますが、その後はキャリアの終わりに過ぎません。そして、キャリアが長い投手は、チームを変更したり、リーグの状況に大きな変化を経験したりする可能性が高くなる。それは多くの可動部分。
意欲的なセイバリストがpitcherのperformanceを予測すると、これがどのように見えるかを見るのは興味深いでしょう(そして、残りのIPが180未満になったらpitcherを除外します)。ピッチャーの現在の才能を予測してみてください。ERAがFIPに追いつかないのはまだ事実ですか?

#3 タンゴティガー 

この問題は一方よりも他方には当てはまらないので、これが問題であることを心配していません。
残りの careerERAはかなり公平であり、それが何らかの形で現在FIPよりも多かれ少なかれ現在-ERAに影響を与えると考える理由はありません。そして、何らか影響があれば、ここでの結論を変えるつもりはありません。
そうは言っても、フロアは意欲的なセイバー主義者のために開いています。これはここで取られた大きな一歩であり、率直に言って長い間来てきた一歩です。うまくいけば、それは他の人のための出発点です。

残りで careerERAを使っても、一般的にどちらの指標に偏りはないはずだには同意。しかし、私は多くのnoiseを追加し、(FIPが再びリードに急浮上する)200試合以降の奇妙な結果を説明するのに役立つかもしれないと思う。その時点で、残りのsampleは約75人の投手で構成され、3分の1は更に200IP以下のIPしか投げられないだろう。私はこの結果をあまり信用しない。

タンゴティガー 

そうだね、終了間際には30人の投手に絞られた。 そして、残りの careerは200IPまでとした。
私は最後のUp-and-downはあまり重要視していない。 9年前の180試合くらいで簡単に「STOP」 pointを置く事ができ、先は対等に扱う。

このことから、MarcelsはERAの代わりにFIPを使った方が(若干)改善されるのではないでしょうか?

タンゴティガー
マルセルはERAと "component ERA"(BaseRunsを使用しているが、未作成wOBAを使用していると考える事ができる)に分けている。

意欲的なセイバー主義者のためのもう一つの可能なproject:以前の歴史的期間(80年代〜90年代、60年代〜70年代、40〜50年代)の分析を繰り返す。これまでのERAがKおよび/またはHRレートが低い期間にFIPを破ったかどうかを見るのは興味深いでしょう。


この記事が気に入ったらサポートをしてみませんか?