ピッチングと卓越性の永続性

2024年1月17日 16:43

野球の魔術の１つは、昨年本当に良かった選手が今年も良くないのではないかの恐れ。 野球 fanは不安なのだ。いつかは必ず起こる事なのだ。金塊が鉛に変わってしまうpandemic的恐怖は、金庫が一晩中開けっ放しになっているのを発見した銀行家のような希望に満ちた恐怖で、野球 seasonの開幕を見守らせている。

この研究目的は、投手として優秀さを維持する要因を調べる事。これらの問題は、新発見はないかもしれないが、答えはある。完璧な理解がない限り、研究を続けなければならない。

問いているのは、この2点：
1）ある投手がある seasonで優秀であった場合、次の seasonでも優秀である確率
2) この確率は様々なinputによってどう変化するか

しかしその前に、"何を優秀な投手と定義するのか？"といった疑問から始めなければならない。

この研究目的のため、 "優秀な "投手を防御率で定義：
1) ERAがリーグ平均より10％以上良い。
2) リーグ平均投手が許す失点より7点以上少ない。

「7失点」という基準には2つの目的がある。
第一に、3イニングを投げて無失点の投手や10イニングを投げて防御率1.80の投手を「優秀な投手」listから除外する。
第二に、定義したかったpercentage(約20％と「リーグより10％良い」)を得られる「Slide indicator」を与える。
2つ目の「より良い失点」の数字を加え、必要な所で切り離せて、20％の投手とリーグより10％良いERAの投手の両方を得る。偶然にも7点差がSerendipity point。
この2つの切り口で、全投手の19.7％が「優秀」と認定された。
20％の基準は、数年在籍したほぼ全ての投手が「優秀」と認定される事があるほど寛大。 20％は殿堂入り基準ではなく、「その年に優れた」という基準なのだ。

また、この2つの測定値は、超一流投手の場合、しばしばほぼ同じ傾向がある。 listを定義するために3つの数字を使用した： M1、M2、M3である。
M1は、投手ERAをリーグERAで割り、1.00から引いて100をかけたもの。
M2は、この投手が投げたイニング数で、リーグ平均の投手が許したであろう自責点数から、この投手が許した自責点数を引いたもの。
M3はM1とM2の最小値。

研究Groupは、「1920年から2015年までのseasonで、少なくとも1outを記録した全投手」。1920年以前はゲームが違いすぎて関連性がないため、1920年から開始し2017年を含めないのは、dataに「先の年」があるように1年後退させる必要があるため。 dataをPark調整できればいいが、このFileにはない。

とにかく、投手をM3で並べ替えると、最高の投手は大抵M1とM2の数字がほぼ同じだとわかる。

ここでの興味深い特徴は、上位seasonのほとんどが最近のseasonが多く入っている。 いつも起こる事ではない。

疑問が浮かぶ：ここにはある種の「過去のbias」があるのだろうか？リーグ標準に対するERAを使ったのはそのため。
そして、一般的にはそうなっているようだ。なぜか最近 seasonが上位に多い。 理由の１つは、私が年をとったからで、私にとって最近に見える事は、実際には野球史の半分以上。 ともあれ、数十年ごとのdataを見ると、「優秀」とされた投手の割合が18.5％（現在の10年）より低くなる事はなく、21.0％（1970年代）より高くなる事もない。

ある seasonで優秀と判定された投手の39.4%は、次の seasonでも優秀と判定される。この調査で「優秀」と判定された投手／ seasonは6,861人で、これは全投手の19.7%にあたる。この6,861人の投手の内、2,703人が翌 seasonも「優秀」と判定されている。この19.7、39.4％の数字は、いずれも長期にわたってほぼ一定、少なくとも安定している。「repeat率」が1940年代に低下したのは、第二次世界大戦という明らかな理由がある。

こうして最初の結論を導き出す事ができる： 投手がある seasonで優秀である確率は、前seasonで優秀であった場合は、前seasonで優秀でなかった場合の2倍以上である。 39.4%は19.7%のちょうど2倍であり、「2倍以上」ではないが、それでも私の発言は真実である。

1920年代には、「優秀」とされた投手の82％が先発、5％がrelief、13％が両方(先発登板が10〜60％、bull pen登板が40〜90％)だった。 1990年以降、優秀な先発投手よりも優秀なrelief投手の方が多くなり、両方で優秀な投手はほぼ姿を消した：
現代 teamは、100年前に比べて1 seasonに多くの投手を起用するようになった。全投手の内優秀な投手の割合が同じである以上、これは1 teamあたり、 season中により多くの投手が「優秀」と定義される事を意味する。

さて、本題に入ろう： repeat率は様々なinputによってどのように変化するのだろうか？例えば、先発投手とrelief投手では異なるのだろうか？
少し。「repeat率」は先発投手では42％、relief投手では37％、混合投手では30％。役割が定まっておらず、実績が十分でない投手である。
1975年以前は、ERAリーグ1位の大部分は、このような役割の混在した投手で、 season中に1つから他の役割へと移り変わっていた。翌年、彼らの防御率はいずれも1点に近い数字で上昇した。何が起こったかというと、若い投手や怪我と闘っていた投手は、その年の開幕をbull penで迎え、ERA1.00か1.25のrelief登板を25～35回こなした。 6月1日から7月1日ごろになると、 teamは先発投手を必要とするので、彼を先発rotationに入れ、彼は15〜20試合に先発し、ERA2.50でseasonを終える。しかし、そもそも彼は傑出した先発投手ではないし、先発投手としての適切なtrainingを受けていない。その年の終わりには、彼はただ耐えているだけで、翌年には同じ選手ではなくなっている事が非常に多い。

現代野球ではそんな事はしない。bull penから先発rotationに入る選手を season途中で急がせたりはしない。とにかく1972年までには、私はこの症候群を認識していたので、混合型投手の「repeat率」は低いと予想していた。

おそらく、リリーバーの割合が先発投手の割合より低いのは、定義の限界に近い投手が多いからだろう。「 M3」の定義優秀さを定義する2つの数値の最小値を思い出してほしい。先発投手の方がイニング数が多いため、M3の数値が大きくなり、定義の限界に近くない「安全な」投手が多くなる。

1970年代、野球記者の間では、リリーフ投手は先発投手に比べて安定性に欠けるというのが定説だった。年配のライターたちは、ほとんどのリリーバーがある年は良かったが、次の年は良くなかった時、リリーバーとしてのロリー・フィンガーズの驚異的な安定性について、壮大かつ雄弁に語っていた。
これが一般に信じられていた理由は2つある。
ひとつは、これらのスポーツライターがこの業界で生まれた1950年代には、ほとんどのリリーバーは二線級のスタッツを持つ選手、ジャンクボーラーであり、やや安定性に欠けていたかもしれない。30代で突然現れ、怪物的なシーズンを送り、次のシーズンには平凡の霧の中に戻っていった。
もう1つの理由は、物事を研究しないと、あらゆる種類の信念が形成されるが研究によって間違っている事が判明するからだ。何も研究しなかったから、多くのナンセンスな事を信じていた。たとえ1930、1940年代のリリーバーにさかのぼったとしても、現代の手法で研究し、少sampleでのデータの不安定さを調整すれば、先発投手とリリーバーの一貫性に大きな差がない事がわかるだろう。実際には、常にほとんど同じなのだ。また、ロリー・フィンガーズの驚異的な安定感について私と議論したい人がいる事は知っている。遠慮なく反論してほしい。

次に年齢の問題である。優秀なシーズンを送った10代の投手の64％が、翌年も優秀な投手として活躍できた。

優秀な投手が優秀であり続ける割合は、38歳でも25歳と同じである。投手が成功した seasonを繰り返す確率において、年齢は明白な変数ではない。

では....投手にとって年齢とは何か？そう簡単には言えない。私の頭の中では物語が出来上がっているので、私の見方で見ている。 基本的には消耗戦。
32歳で1000人の成功した投手がいたとして、そのうちの30％が33歳で怪我をして700人、30％が34歳で怪我をして490人......と、全員がいなくなるまで続く。しかし、ある投手がまだ成功している場合、その投手が33歳であろうと40歳であろうと、第三者にとってはほとんど関係ない。

変わるのは復帰する能力だ。 26歳の投手が怪我をすれば、 careerを再構築する時間があるかもしれない。 33歳なら復帰までの時間は短く、40歳なら時間がない。

次に奪三振率に注目しよう。奪三振率は、9イニングあたりの奪三振数という絶対値で見る事も、リーグとの相対値で見る事もできる。まずは絶対値奪三振率から。 この中で最も奪三振率が高かったのは2014年のアロルディス・チャップマン（9イニングあたり17.67奪三振）、最も低かったのは1924年のアーニー・ウィンガード（9イニングあたり0.95奪三振）だった。そして、上から5番目のグループが687人であることを除いて、投手を686人ずつの10の十分位に分けた。
奪三振率上位686投手のうち、376投手が翌シーズンも活躍した。下位686投手のうち、223投手だけが翌シーズンも活躍した：
明らかに奪三振率は「リピート成功」率に影響を与える。しかし、その代わりに、リーグの奪三振率に対する奪三振率で投手を並べ替えたらどうだろう？そうすれば、この要因の選別力は向上するだろうか？

そうだ：

データを十分位で並べ替え、十分位の測定値の標準偏差を測定する。測定がより効果的になれば、上位のグループは下位のグループからさらに離れ、十分位測定の標準偏差は増加する。それは、0.074から0.089へと著しく増加する。この記事の続きでは、これを「74から89」と呼ぶことにする。

三振が将来の成功の可能性で投手を分類するなら、四球はどうだろうか？このグラフは、生の四球率に基づいて投手を同じように分類したものである：

ここでは10段階評価の標準偏差は0.054（54）である。四球率は、成功し続ける能力の指標として大きな有効性を持つが、奪三振率よりはパワーが弱い。最も乱暴な投手は1949年のトミー・バーンで、196イニングで179人を歩かせたが、防御率は3.72だった。四球が少なかったのは2005年のカルロス・シルバで、188イニングでわずか9人しか歩かせていない。イニングあたりの四球数をリーグ標準と比較してみよう：

ここでもまた、リーグ標準を調整すると、増加幅はそれほど大きくはないものの、測定の有効性は高まる；ここでの標準偏差は57である。おそらく、リーグ標準の四球率を調整することは、リーグ標準の奪三振率を調整することよりも影響が少ないと思われます。奪三振/与四球率を生で見てみよう：

私たちが発見した中で、最も効果的な「効果的な投球を続ける能力」の予測因子であり、標準偏差は前述の通り91である。

さて、私には2つの方向性がある。 strike zone勝率と呼ばれる、三振と四球の比率をリーグ標準と比較する、おそらく10年前に私が開発した方法があります。しかし、トム・タンゴは、奪三振と与四球の最適な評価基準は奪三振率と与四球率ではないと主張している。 2人の投手が200イニングずつ投げたとする。一方の投手は100人の打者から三振を奪い、25人の打者に四球を与え、その比率は4対1である。もう一人の投手は150人の打者から三振を奪い、75人に四球を与え、その比率は2対1である。これらの投手のインパクトは同じか、それとも違うか？

トムは、これらの投手は奪三振と与四球の比率は異なるが、基本的に失点欄に与える影響は同じだと主張する。したがって、重要なのは奪三振と与四球の差だと彼は主張する。

つまり、三振対与四球率もまた細分化されるのである。後述する生の三振対与四球率を研究することもできるし、イニングごとの三振対与四球率を研究することもできる。イニングごとの奪三振対与四球率：

これらの投手のうち、イニングあたりの奪三振率で最高の10％の投手は、翌シーズンも優秀である可能性が58％であり、これは我々がまだ見たことのない最高の割合である。

ストライクゾーン勝率とは、投手の奪三振数にリーグ四球数（か1試合あたりの四球数）を掛けたものを、同じプラスリーグ戦の奪三振数に投手の四球数を掛けたもので割ったものである。つまり、投手の奪三振をP-SO、リーグ奪三振をL-SOとする：

K Zone Winning Pct = (P-SO * L-BB) / [(P-SO * L-BB) + (L-SO * P-BB)]

このデータでKゾーン勝率.900を記録している投手は、1989年に.916、1990年にも.916を記録したデニス・エカーズリーだけである。先発投手の最高は1994年のブレット・セイバーハーゲンの.849である。これまでの研究で、ストライクゾーンの勝率は投手の実際の勝率と非常によく相関することが示されている。

いずれにせよ、strike zone勝率（リーグ調整済み奪三振／与四球率）は、継続的優秀性を予測する有効性という点で、これまで我々が見てきた他の全てを吹き飛ばしている：

このスコアは122点で、我々がこれまで見てきた中で断トツに高い。このスコアは122点で、我々がこれまで見てきた中で断トツに高い。

では、見てみよう。奪三振率の「スコア」が91、1イニングあたりの奪三振マイナス与四球が92、リーグ調整後の奪三振マイナス与四球が122だとすると、リーグ調整後の9イニングあたりの奪三振マイナス与四球はどうだろう？計算式を書く必要があるのか、それとも自己流なのか？用心するに越したことはない。. . .

(p-so -- p-w) / p-ip ] / [(l-so -- l-w) / l-ip].

さて、（チャートを飛ばして）92点という点数だ。.これには明らかな問題があることがわかった。奪三振率と与四球率の差が9イニングあたり0.03から0.05しかないリーグもある。そのようなリーグでは、1試合あたり奪三振が与四球を1.00上回る投手は、20か30で出てくる。 1947年のイーウェル・ブラックウェルは107.69。このため、この計算式は予測力を失うことになる。

この問題を解決するには2つ方法がある。
まず、リーグ平均で割るのではなく、投手のデータからリーグ平均を差し引く方法に変える事だ。...試してみる：おお。得点は127点だ。いいね。

つまり、投手の奪三振から9イニングあたりの四球を引いたものをリーグのデータで割る前に、リーグのデータに何かを足して、それがゼロに近くならないようにする。

Xとは何か？結果を最大化するためにリーグデータに加える数字は何ですか？実験するのは簡単だ。 1.20を加えることで最大の結果が得られることがわかった。 1.20は1.10や1.30よりも効果がある。1.20は1.19や1.21よりも効果がある。これはそのためのデータである：

得点は126点だ。...基本的にはリーグの数字を引くのと同じだが、それよりは良くない。以前、三振から四球を引いたものだけを使った場合の影響を調べると約束したが、1965年のサンディ・クーファックスは+311（382、71）、1949年のディック・ファウラーは-42（43三振、115四球）となる：

これは117点で、非常に良い数字である。本塁打率の影響をチェックしてみよう。生本塁打率

今のところ何もない。33点。リーグ標準との比較に移ろう。 1937年のスリック・キャッスルマンは、被本塁打率がリーグ平均の6倍だったにもかかわらず、非常に効果的だった：

まあ、これはさらに悪いことだ。予測に役立つものは何もないようだ。私は次に進む。

投球イニング別の優秀性保持率を見てみよう。下の左側の列は、グループ内の投手の平均投球イニング数である：

M1は投手のERAをリーグERAで割り、1.00から引いて100をかけたもの。
M2は、この投手が投げたイニング数で、リーグ平均の投手が許したであろう自責点数から、この投手が許した自責点数を引いたもの。
M3はM1とM2の最小値。

資格基準ぎりぎりの投手よりも、非常に優秀な投手の方が優秀さを維持しやすいと予想されますよね？下のグラフでは、左側の数字がグループの平均M3である：

113点である。 M3の数値は優秀さを維持するための良い指標であることがわかったが、我々が見た中ではベストではなかった。私はM3が最高の指標になると思っていたが、そうではなかった。また、M1の数値（これは単にリーグ標準に対するERAである）は、優秀性を保持する能力の指標としては非常に悪い（41）のに対して、M2の数値は非常に良い指標（118）である。これがM2である：

ここで総括の段階に入る前に、もう一つ見ておきたいのは、連続シーズン優秀投手である。明らかに、5シーズン連続で優秀な成績を収めた投手は、1年だけ優秀な成績を収めた投手よりも優秀な成績を繰り返せるに違いない。では、それを見てみよう。. .

マリアノ・リベラは16年連続で優秀な seasonを送った。下の表で「10」は「10以上」を意味する：

初めて（連続）優秀なシーズンを終えた投手が、翌年も優秀なシーズンを送る確率は34％である。数字が小さくなるためデータは不規則になるが、7年連続で優秀なシーズンを送った投手が8年目も優秀なシーズンを送る確率が71％になるまで、この確率は概して上昇する。

つまり、私が見つけた最良の指標は、M2の数字と、投手の奪三振から与四球を差し引いたものからリーグ差を差し引いたもの。この2つをどのように組み合わせれば、どちらか一方だけよりも効果的な数字になるのだろうか？

M2は7から77のスケールで、標準偏差は9.49。奪三振率は-5.1～+10、標準偏差は1.78。この2つを単純に足し合わせると、M2の数値が支配的になり、M2単体より進歩する事はない。

奪三振率の方が2つ（127対118）の予測因子として優れているので、M2の数値よりも奪三振率の方が組み合わせに大きな影響を与えるようにしたい。奪三振率の数字を6倍してからM2に加えると、標準偏差の比率は10.7対9.5となり、ほぼ適切な比率になる。それでは試してみよう。...M2に投手の奪三振率の6倍を加えた数字からリーグ標準を引いた数字を新たに作成する：

私がこれまで使ってきた方法で製造されたこの数字の予測力は158である。

つまり、優秀投手の上位10％に入る投手は、優秀投手として再登場する確率が71％であるのに対し、下位10％に入る数字を持つ投手は、優秀な投手として再登場する確率が18％しかない。無作為に選ばれた投手が今 season優秀である確率は20％。昨年優秀であったが、優秀差（M2）が大きくなく、奪三振率と与四球率が良くなかった投手は、優秀であり続ける確率は18％しかない。

私が取り組んだ最後の疑問は、その投手が連続して優秀なシーズンを送った数を考慮する事によって、この製造された数字の予測力を向上できるかどうかだった。しかし、できなかった。連続優秀シーズン数を加味してこの数値を改善しようとした私の試みはすべて、予測力を高めるどころか、むしろ低下させた。

「優秀リピート予測」：
投手の9イニングあたりの奪三振から与四球を引く
同リーグ平均を引く
6倍
＋ERAで測定されるリーグ平均投手と比較して、その投手が防いだ失点数。

この記事が気に入ったらサポートをしてみませんか？