Won-Lost Recordsの信頼性、パート2
本稿は、8月22日に掲載した「信頼できる打率」の続編である。 その記事では「真の打率」を仮定し、"打者が真の打率に達するには何打席必要か?"という問いを扱ったが、この記事では投手の「真の勝率」を仮定し、"投手が真の勝率に達するには何先発登板が必要か?"という問いを扱う。
同じ目標を持っているにもかかわらず、その記事で使われた方法とこの記事で使われた方法にはほとんど共通点がない。 そのプロセスは投手の勝敗記録では機能しないのだ。 この研究の方法はこうだ。
まず、各試合における各投手の勝率を、走者の援護や試合結果には関係なく、単純にその投手がどれだけ良いピッチングをしたかに基づいて設定した。1試合の勝率がどのように設定されたかは、後で説明しよう。
次に、各投手の各シーズンとキャリアの平均勝率を算出した。 先発のみで、救援登板は考慮しない。 その結果が投手の真の勝率である。
次に、その投手の現実の勝率、つまり百科事典やその他の情報源に示されている勝率と、その投手の真の勝率を比較した。
そして、研究対象の全投手でグループを作り、「その投手の勝敗成績と真の勝率の間には、通常どの程度の開きがあるのか?
この構成で重要なのは、各先発登板に勝率を割り当てるという最初の問題である。 これが終われば、あとは簡単だ。
そのプロセスを説明するために、ドン・アーセを使おう。 ドン・アーセはアルファベットなので、私がこのようなことを研究するのに使っている329,989行のデータファイルのスプレッドシートの一番上の行にあり、私はいつも一番上の行に数式を書くので、ドン・アーセのキャリアは私の妻の顔を知っているよりもよく知っている。 いつもは彼をイラストに使うことはないのだが、ここでの彼は実にうまく機能しているので、アーセにしよう。
ドン・エイースは、40年後のタナー・フックと同じように、殿堂入りを果たすようなピッチングでキャリアをスタートさせた。 メジャー初登板となった1977年7月26日、アーセは11人の打者から三振を奪い、ミルウォーキーを4対3で下し、完投勝利を収めた。 ミルウォーキーの失点のうち1点は無失点だった。 アーセのゲームスコアは68。
先発投手のゲームスコアが68の場合、チームはたいてい勝つ。 私のデータでは、先発投手がゲームスコア68を記録した試合が5,103試合あり、そのチームの勝率は.762 34である。 ということは、アーセの勝率貢献度は.762ということになる。
この場合の最大の問題は、ゲームスコアは50を中心に組み立てられるが、平均50で固定されるわけではないということだ。 1999年のクアーズ・フィールドでの投球は、1968年のドジャースタジアムでの投球とは大きく異なる。 我々は、ゲームスコアの基準を(a)シーズン、(b)リーグ、(c)パークに合わせて調整しなければならない。
1977年の第1戦はフェンウェイ・パークだった。 1977年のフェンウェイ・パークの調整済み平均ゲームスコアは44.84で、これは例外的に低い。 1977年のアメリカン・リーグは当時、1956年以来最も得点率の高いリーグであり、フェンウェイ・パークはパーク・ラン・ファクター137という球界最高の打者用パークだった。 打撃が上がると投球が下がるので、平均ゲームスコアはそこで5ポイント下がる。 もちろん、そのパークでの平均Game Scoreを計算し、それをホームチームの打撃と投球で調整しなければならないので、それは面倒だが、44.84が私のできるベストだ。
ということは、アーセの第1戦は、50点以上の68点ではなく、44.84点以上の68点ということになる。 45とすると+23。
先発投手がパーク/シーズン標準より23ポイント良い場合、彼のチームは85.2%の確率で試合に勝つ。 このデータは実際には「平滑化」されている。+23の投手が数千人、+22の投手が数千人などであるにもかかわらず、データはまだ少し飛び跳ねており、連続する2つの数字の間に非論理的なジャンプが生じることがある。 この場合、平滑化前は0.852、平滑化後は0.852だが、おそらく余分な桁に多少の変化があるのだろう。
とにかく、投手がパーク/シーズン標準に対して+23のとき、彼のチームは85.2%の確率で試合に勝つので、メジャー初戦のアーセの勝率を.852と記入する。 彼は試合に勝ったので勝率は1.000(1勝0敗)だが、彼の「真の勝率」は.852に過ぎない。つまり、毎試合あれだけのピッチングをすれば、いずれにせよチームが負けることもあるということだ。
アーセの2度目の先発はカリフォルニアのビッグAで、そこはパーク/シーズン標準が52.23というピッチャーズ・パークだった。 アーセは3安打完封、ゲームスコア87。 彼の2試合目では、対ノルムで+35だった。
投手が対ノルマ+35の場合、チームは94.4%の確率で勝利する。 2試合で.852と.944、合計1.796、平均.898。 2試合を終えたaseの真の勝率は.898。 勝率はまだ1.000(2勝0敗)だが、真の勝率は.898。 これは.102のギャップ(乖離、誤差)である。
アーセの3度目の先発はオークランド・コロシアムで、ここもピッチャーズ・パークであるため、Park/ season標準は52.29となった。 7回、5安打、1失点。 ゲームスコアは62にとどまった。 その seasonのそのパークでの62は+10である。 先発投手のゲームスコアが+10の場合、チームは63.9%の確率で勝利する。 つまり、3試合合計で2.435、平均.812となり、aseは3勝0敗(1.000)だが、真の勝率は.812である。 3試合に先発した時点で、勝敗に基づく勝率と、投球内容のみに基づく真の勝率には188ポイントの開きがある。
真の勝率は、アーセが将来どれだけ良いピッチングをするかという予測ではない。 それは、彼がこれまでどれだけ良いピッチングをしたかを要約(推定、声明)したものである。 先発するたびに変化する。
1977年8月11日にフェンウェイで先発したアーセのキャリア4度目の登板で、彼は初めて大打撃を受け、キャリア初の敗戦を喫した。 ドン・ベイラーとボビー・ボンズにホームランを打たれ、5回6失点でゲームスコアは29。 投手のGame Scoreがパーク/リーグ標準より16ポイント悪い場合、彼のチームは26.5%の確率でしか試合に勝てないので、その試合のaseの勝率貢献度は.265である。 4試合を通しての勝率貢献度は2.700、つまり平均.675である。 つまり、4試合後の勝率は.750(3勝1敗)だが、真の勝率は.675である。
ドン・アーゼのcareerにおける全ての先発登板について聞きたくはないだろう。 最初の seasonを終えた時点で、エイースは6勝2敗、勝率.750、しかし真の勝率は.606であった。 6勝2敗という成績が示唆するほどではないにせよ、彼はよく投げた。 しかし、もし彼が1977年(勝率.606)と同じようにキャリアを通して好投していたら、おそらく殿堂入りしていただろう。 ご存知のように、彼は殿堂入りしていない。
rookie yearの後、レッドソックスはアーゼが殿堂入りするとは思っておらず、ジェリー・レミーとカリフォルニアにtradeした。 カリフォルニアでの最初のシーズン、1978年、アーセは29試合に登板し、11勝8敗に終わった。 実際、防御率4.03、奪三振/与四球率93-80とそれほど良い投球ではなかったので、真の勝率は.477に過ぎなかった。 勝率は実際の成績を102ポイント上回った。 2シーズンを通して彼は17勝10敗、勝率.630だったが、真の勝率は.518だった。
LAでの2シーズン目は28試合に先発し、8勝9敗(勝率.471)、勝率.468とほぼ同じ成績だった。 LAでの3年目(career4年目)のシーズンは、5勝13敗、防御率4.90という成績で、7月末に先発rotationから外された。 実際にはそれほど悪い投球ではなかった。 勝率は.278(5勝13敗)、真の勝率は.419であった。
アーセは、デトロイト戦で初回に無死一、二塁から4失点し、先発ローテーションから外された。 その後10年間メジャーに在籍したが、メジャーリーグで先発することはなかった。 先発投手として4年間で91試合に登板。 先発投手としての成績は30勝32敗、勝率.484、実質勝率.480。 つまり、彼の場合、勝敗記録は実際の投球内容を非常に正確に反映したものであり、クレジットされた勝率と真の勝率の差はわずか4ポイントしかない。
もし誰もが4ポイントしか違わないのであれば、勝敗記録の正確さは80%だろうという私の推測を修正して、99%正確だと言わなければならないだろう。 しかし、残念ながらそうではない。 データをどう一般化すればいいのか、データを一般化することに価値があるのか、私にはよくわからないが、ツイッターで私が行った80%というその場しのぎの推測は、少し気前がいい。 私なら70%にするかもしれない。
状況によって投手の記録に注ぎ込まれる外部からの貢献を無視して、キャリアの勝敗記録が投手の投球の良さを正確に反映している投手はたくさんいる。 キャリアの真の勝率が記録上の勝率とほぼ同じ投手には、先発としての勝利数が多い順に(私のデータ内で)... .記録が彼らの投球を正確に表している投手は、フアン・ピサロ、ハリー・ブリーチーン、ラルフ・テリー、アレックス・フェルナンデス、ティム・リンスカム、ハーヴィー・ハディックス、バディ・ブラック、アール・ウィルソン、マイク・スコット、ライアン・デンプスター、パット・ヘントゲン、フランク・ラリー、ヴァージル・トラックス、ラリー・ディアーカー、ジョシュ・ベケット、ブレット・セイバーハーゲン、バリー・ジトー、フェリックス・ヘルナンデス、フェルナンド・バレンズエラ、ラリー・ジャクソン、ビリー・ピアース、ティム・ウェイクフィールド、デビッド・コーン、ドン・ドライスデール、ペドロ・マルティネス、ジョン・スモルツ、ルイス・ティアント、ランディ・ジョンソン、トム・シーバー、ドン・サットン、スティーブ・カールトン、ロジャー・クレメンス。
他にもたくさんいる。 しかし、記録が物語るように優れた投手はたくさんいる。
そうでない投手もたくさんいる。 明日の記事では、より一般的な問題として、勝率と真の勝率が一致し始めるまでの時間について取り上げる。
昨日の記事の読者の中には、2017年8月の記事で使った方法を使うことを提案してくれた人もいた。 私は基本的にそうしてきたつもりだ。 この方法はその方法と完全に同じではないが、本質的には同じ方法であり、異なる質問に答えるために再調整しただけである。
この記事が気に入ったらサポートをしてみませんか?