信頼できる打率

私のBallpark Leagueでは、投手が打率でコード化されるという問題がある。 私のような年寄りは、1960年代初頭にハンク・アギーレが球界で最も悪名高い悪打者だったことを覚えているだろう。 彼はその後、サンディ・クーファックス、そしてディーン・チャンスに取って代わられたが、私が野球の本を読み始めた頃は、ハンク・アギーレがいかにひどい打者であったかというジョークや話はよくあった。 アギーレはcareerで388打席に立ち、33安打を放ち、career平均は.085だった。 ホームランは一度も打った事がなく、388打席中236打席と6割以上の打席で三振を喫した。
しかし1967年、36歳のリリーバーは2打席に立ち、三塁打を放った。 これが彼のcareerで唯一の三塁打だった。 彼は season打率5割1分2厘であったので、ボールパークはかなり奇妙な洞察力の欠如を示して、彼をseason打率5割とした。 唯一の安打が三塁打であったため、彼のカードではほぼ全ての打席が三塁打となっている。 球場のmanagerは、投手の出番が来る前に彼をこっそり試合に出したくなる。 なぜなら、もし9回表に1点差に迫られていて、彼をゲームに投入することができれば、9回裏の先頭打者として、全盛期のバリー・ボンズよりも高い打率を誇る5割バッターを起用することになるからだ。 この差は大きい。

私はこの極端な例を使って、「真の」打撃能力の概念を説明する。 ハンク・アギーレの真の打率が.500でない事は明らかだ。 それは信頼できない数字だ。 私が言いたいのは、ある選手の打率がその選手の根本的な能力を示す信頼できるものになるまでには、何打席必要かということだ。 100打席、200打席、500打席後の選手の打率は(彼の真の能力を示す指標として)どの程度信頼できるのか?

ここで強調しておきたいのは、私が言っているのはあくまでaverageを出すための真の能力についてだけだということだ。 もちろん、マイク・シュミットのように驚異的な生産性を誇る.270打者もいれば、マニー・トリロのように全く生産性のない.270打者もいる。 私はここでそのような問題を扱っているのではなく、単に打率の信頼性について話しているのだ。 パーク効果の話もしていない。

なぜ私が72歳になるまでこの事を研究するのに時間がかかったのかわからないが、これは私が満足するほどその疑問を解決する、かなり直接的で単純な研究である。 私がしたことは

  1. 1,000人のシミュレートされた各選手の「既知の」打率を生成した。 既知の打率は、理論的には.170から.370の間のどこにでもなり得るが、.270付近に集まる傾向があった。

  2. 無限回の打席で、選手がその打率に正確に一致するようなランダム化プロセスを作成したが、HITとOUTの順序はランダムであった。

  3. 私は、ある選手が無限の打席数でその打率に正確に一致するようなランダム化processを作成したが、HITとOUTの順序はrandomであった。

しかし、打撃はランダムではない。 それはpitcher、batterのperformanceに左右される。 それは技術であり、ランダムなものではない。

まあ、そうだ。 batterの一連の打席はランダムな連続ではない。 batterの打席はランダムではないが、ランダムの識別可能な特徴のほとんどすべてを持っている。 ランダムではないが、ランダムの特徴を持っている。 飼い犬のようなものだ。 世界のどこかに、あなたの犬と同じ本数の足と目と耳を持ち、あなたの犬と同じ身長と体重を持ち、あなたの犬と同じ色と模様の犬がいる。 彼はあなたの犬の(ほぼ)すべての特徴を持っているが、あなたの犬ではない。 選手の一連の打席はランダムではないが、各打席と次の打席を分ける長い長いランダム化要因があるため、patternは random性の識別可能な特徴をほぼすべて持っている。

では、.270の打者が.270の打率を確実に期待できるようになるには、どのくらい時間がかかるのだろうか?

さて、この研究で言う「信頼できる」とはどういう意味だろうか?

「信頼性」とは、正確さの頻度を意味する。 仮に、X回打席に立った後、すべての選手の打率が本当の実力と同じだったとしよう。 もしそれが本当なら、X打席後の選手の既知の打率は、その選手の真の打撃能力を100%信頼できる指標だと言える。

しかし、それは「正確さ」を定義しなければならないことを意味する。 ある選手の真の打率が.280であるにもかかわらず、.282を打ったとしたら、あなたはそれを「不正確」とは言わないでしょう? それはかなり正確だ。

しかし、ある選手の本当の打率が2割8分で、3割2分5厘を打ったとしたら、あなたはその打率が彼のバッティング技術を正確に測るものだとは言わないでしょう? そうでしょうね。 彼は本当は3割2分5厘の打者ではない。

私は、この研究の目的上、30点が "正確 "と呼べる限界の外側にあると判断した。 真の2割6分打者の選手が2割8分9厘を打った場合、それはあまり正確ではないが、3割2分5厘や1割9分5厘を打った場合よりは正確である。 乱暴に不正確というわけではない。

これは私が使った尺度である。 もし選手の "試行 "打率が "真の "打率と同じなら、打率は100%正確である。
もしある選手の「試打」打率が本当の打率から1ポイントずれていたら、私はそれを97%の正確さとして採点する-30点満点中29点。
ある選手の試打の打率が真の打率から2ポイントずれていた場合、私はそれを93%の正確さとして採点する。
もしある選手のtrialでの打率が、本当の長期的な打率から25点ずれていたら、私はそれを17%しか正確でないと採点するだろう。
また、ある選手の打率が本来の打率から30点ずれていたとしたら、それは正確とは言えないだろう。 29点差なら正確さは3%だが、30点差なら正確さは0%だ。
信頼性とは、ある打席数における、多くの選手の平均的な正確さのレベルである。 50打席の時点で、この調査における平均的な打者のprototypeの打率は、彼の真の基本的な打率を表すものとして17%の正確さであった。 平均すると、50打席に立った選手の打率は、本来あるべき打率から25pointずれる事になる。

これは100打席までの打率の信頼性のグラフである:

10打席 8% 平均28点以上の誤差。
20打席 11% 平均エラーは打率27点以上。
30打席 14% 平均エラーは打率26点以上。 more than」を以下の文章に読み込んでください。後で説明する。
40打席 15% 平均エラー25-26ポイント。
50 打席 17% 平均エラー 25 点 打率。
60 打席 19% 平均エラー 24 点 打率.
70打席 21% 平均エラー 24点 打率.
80打席 23% 平均エラー 23 点 打率.
90打席 25% 平均エラー 22-23点 打率.
100打席 26% 平均エラー 22 点 打率.

つまり、100打席後の選手の打率は、その選手のaverage hitterとしての真の能力を示すものとして、約26%の信頼性があり、平均的なbatterは、彼の真の長期的な打率から22ポイント以上ずれている。 ここでもう一つ有用な質問がある。"X回の打席で、真の打率から30ポイント以内に入る選手は何人いるか?"である。

20打席では、21%の選手が真の打率の30ポイント以内に入る。 30打席では28%。 さらに10打席増やすと、31%、35%、38%、42%、46%、48%、51%となる。 100打席を終えた時点で、本来打つべき打率と30point以内の打率を持つ選手は半分、そうでない選手は半分ということになる。

以上という事。あるLevelの打席で、打率の信頼性が10%だとしよう。 そうすると、90%は不正確ということになる。 仮に30点の信頼性が0%だとすると、10%の信頼性は27点の平均誤差を意味することになる。

そうだが、30点より大きなエラーは事実上30点としてカウントされているので、そうとは言えない。ある選手の打率が本来あるべき値から30点離れていれば、それはゼロとしてカウントされるが、40、50、60点離れていれば、それもゼロとしてカウントされる。 つまり、27点の平均誤差は、実際には27点以上の誤差を意味する。 この効果は1500から2000打席まで続く。 1500打席から2000打席を過ぎると、30点以上の誤差を持つ選手はいなくなるので、2000打席以降は「8点以上」ではなく、「8点」でしかない。 (もし私がこの研究をやり直すのであれば、この問題は回避しただろう。ある時点で次の研究に進まなければならない)

そこからは

打席  打率の信頼性
125       28%
150
175
200
225
250
275
300


31%
34%
35%
37%
39%
40%
41%
平均打率の誤差
.022
.021
.020
.020
.019
.018
.018
.018
真の平均から30ポイント以内の選手の割合
53%
60%
63%
64%
67%
69%
72%
74%

300打席後の選手の打率は、彼が打つべき打撃の指標として41%の信頼性がある。 74%の選手はその時点で本来の実力から30ポイント以内であるが、30ポイントというのは大した主張ではなく、一般的に.200から.340までの範囲のうち60ポイント、つまり140ポイントである。

フルシーズン分の打席数とはどのくらいだと思いますか? 550打席はどうですか? 550打席というのは、レギュラーが1シーズンに獲得する打席数ですよね? その時点での打率の信頼性は?

打席数
350
400
450
500
550
600
650
700
打率の信頼性
44%
46%
49%
51%
53%
55%
57%
58%
平均打率の誤差
.017
.016
.015
.015
.014
.013
.013
.013
真の平均から30ポイント以内の選手の割合
77%
81%
85%
89%
90%
91%
93%
95%

550打席での打率は、その選手が打つべき打率の指標として51%の信頼性があるが、平均的な打者はあるべき打率から14point離れている。 ある選手がある年に.330を打ち、次の年に.285を打った場合、メディアはそれについて説明を与えるだろうが、実際には何の意味もない。 たまたま起こることなのだ。 shortが捕った tipshotやlinedriveは、550打席で均等になるわけではない。 そうなるには1シーズン以上かかる。

では、マルチシーズンの数字を見てみよう:

打席数
1000
1500
2000
2500
3000
4000
5000
6000
打率の信頼性
64%
70%
73%
76%
77%
81%
83%
84%
平均打率の誤差
.011
.009
.008
.007
.007
.006
.005
.005
真の平均から30ポイント以内の選手の割合
98%
99%
100%
100%
100%
100%
100%
100%

特筆すべきは、1500打席後の平均打率が、本来打つべき打率から10point以内に収まっていることである。 選手の平均打率と本来の技術レベルとの差が10point以下に縮まるには、 regularとして約3年かかる。 2000打席までに、100%の選手が本来打つべき打点の30point以内で打てるようになる。 この研究では、4,146打席を終えてもまだ31pointも目標から外れている "選手 "がいた。
6,000打席はかなり長いcareerであり、regularとして10年かそれ以上である。 6,000打席を経験すれば、その選手の打率が本当の実力から30ポイント以内であることは本当に、本当に確実であり、10point以内であることよりも90%確実である。 そして最後に、このチャートである:

打席数
7000
8000
9000
10000
11000
12000
13000
打率の信頼性
86%
87%
87%
88%
89%
89%
90%
平均打率の誤差
.004
.004
.004
.040
.003
.003
.003
真の平均から30ポイント以内の選手の割合
100%
100%
100%
100%
100%
100%
100%

13,000で止めたのは、careerが長くなるのと、データが私の小さなcomputerにstressを与えたからだ。 1,000人の選手と各選手の13,000のイベント、そして各イベントを生成して記録し、各打率を計算して「真の打率」と比較するために9つのセルが必要で、他のカウントを含めるとスプレッドシートは2億5,000万セルを超える。 実際には、2億5000万セルすべてを同時に "ライブ "にしておく必要はない。 私のコンピューターがそんなことをするとは思えない。

もう1つ小さなポイントがある。低い打率は、同じ打席数で、高い打率よりも高い信頼性を達成する。 200打席では、3割バッターは2割バッターが2割5分打つより3割5分打つ可能性が高い。 かなり明白な理由なので、説明は省略する。
いずれにせよ、結論は、打率が技術や条件を表し、もはや運による意味のある影響を受けないように、すべてのブループとブリーダーが確実に均等になるには.....それは選手のキャリアよりもずっとずっと長い時間がかかる。 13,000打席という、ほとんど誰も到達しない打席数では、打率は90%信頼できるものだが、平均的な選手はまだ3ポイント上回ったり、3ポイント下回ったりしている。 ある選手の打率が、その選手の技術レベルを100%正確に示すには何打席必要なのかについては、私にはわからないが、データから見て5万打席以上である事は明らかである。

もうひとつ説明しておきたいことがある。......私は、この記事や他の記事に対するあなたの反応についてコメントすることはできません。 ソフトウェアの問題です。 お気づきかもしれませんが、私たちのソフトウェアは必ずしも私たちが望むようなものではありません。 このソフトウェア・アーキテクチャは15年前に作られたもので、もう数年一緒に仕事をしていない会社によって作られたものです。

同じ名前でパスワードが異なるログインIDを2つ持っていて、1つは読者体験に、もう1つは管理者サイトに行くというものだった。 管理者用ソフトウェアが私にパスワードの更新を強要すると(それはかなり頻繁に行われるのだが)、私たちには理解できない奇妙なことが起こり、私はリーダー部分への進入経路を作り直さなければならなかった。 それが煩わしかったので、コンピュータ担当者に、ログインが1回で済むように直してもらえないかと頼んだら、直してくれた。 あなたの投稿を読むことはできるけど、それに返信することはできない。 だから.厄介なんだ。 あなたはおそらく、私たちのソフトウェアが厄介であることを知っているでしょう。 お詫びを申し上げるとともに、コメントへの返信ができないことを残念に思う。 ハチドリを調教して指に火をつけさせる方法もあるでしょうが、どちらも私にはわかりません。 読んでくれてありがとう。

この記事が気に入ったらサポートをしてみませんか?