4月の成績 vs 5月以降の成績【MLB】

特に新しい話題でもないので多くの人が調べているとも思いますが、タイムリーな話題ではあると思うので4月の成績と5月以降の成績の関連性について指標ごとに改めてまとめて、各指標に対する所感なんかも語ってみます。一応タイトルに【MLB】と付けましたがNPBでも大して変わらないと思います。

∇打者

まずは打者からです。対象とした打者は2015~2023年(2020年は除く)の3・4月と5月以降でどちらも規定打席に立った打者です。本当は生存バイアス等にも対処した方が良いと思いますが今回は手軽にいきます。

◆ vs 指標自身

まずは指標自身の話です。「4月のBABIPと5月以降のBABIPって相関あるの?」という感じの話。野球ファンからの関心がそこそこ高そうな指標を中心にピックアップしたものがこちら。

これは野球に限らないことだと思いますが、ファンが第一に気にするような結果ではなく、その結果が出る前の過程を測った指標ほど強い相関を示しています。

打者のアプローチ姿勢(Swing%, Contact%)、打者のパワー(打球速度, Hard Hit%)、打者のスイング軌道(打球角度, GB%, FB%)のようなものはシーズン序盤から安定しても、それらに加え内外の様々な変数が組み合わさった結果完成する指標(BABIP, wOBA等)は安定に時間がかかることは想像に難くありません。

ゴロとフライの境目であるライナー、引っ張りと流しの境目であるセンター返しも安定に時間がかかりますが特に気を付けるべきはライナー。ライナーは他と比べて恐ろしく生産性の高い打球ですが、ライナーの発生確率が信頼に足るサンプルサイズに達するのは500~600BBEほど。これは上位打線で年間フル出場近く出場しても選手によっては到達できない数字です。

wOBA - xwOBA(0.222)は使用球場の偏りを留意しておく必要はあるでしょう。参考までに、同期間のwOBA - xwOBAはクアーズで .029、ブッシュで -.011です。

Clutch(0.034)、打率 - 得点圏打率(-0.032)は美しいですね。

◆ vs wOBA

次は5月以降のwOBAとの比較です。三振しないことや速い打球を飛ばすことはあくまでも手段です。目的=勝利に貢献 ≒ 得点に貢献 ≒ wOBAの高い打者は4月のどの指標でその兆しを見せていたのでしょうか。

一応相対的にカラースケールしてますが軒並みしょぼいです。
xwOBAですら決定係数は0.156、5月以降のwOBAをほとんど説明できません。

気を付けるべきはコンタクト系の指標ですかね。コンタクト系の指標はコンタクト力(という言い方も少し違いますが)を測る指標としては信頼度は高いですが、打者においてコンタクト力は単純に得点創出力に結びつきません
これはイチローのあの .220 40本発言が野球ファンに違和感なく受け入れられているようにコンタクト能力と長打力にトレードオフ関係があることを直感的に理解している人は多そうです。

実際のトレードオフ関係を定量化するのは割と大変だと思いますが、現状コンタクト力とK%には強い因果があるのに対して、コンタクト力と得点創出力には相関はありません。これの意味するところはコンタクト力の低い打者は三振による損失を他で補っているということです。

丁度良く実例があるので紹介すると、2023年MLBで最も低いK%を記録しながらISO最下位、wRC+は92に甘んじたガーディアンズは昨オフ従来のアプローチ姿勢を打ち破る意向を示し、2024年4月終了時点で昨年からK%の順位を落としながらISO15位、wRC+107とそのトレードオフを成功させています。今年のガーディアンズは要注目です。

∇投手

では投手です。対象とした投手は3・4月と5月以降でどちらも規定投球回に達した投手。

◆ vs 指標自身

・K/BB(0.249) vs K - BB%(0.576)
その簡易な算出方法から日本のライトなプロ野球ファンからの認知度も高いK/BB、比だからこそ広まった感じもしますが比であることが悪さをします。
例を挙げるなら、K% 20%, BB% 1%が実力の投手がK% 20%, BB% 2%を記録しても100打者あたり1人多く四球を出しただけの変化であり、実際K - BB%は19%から18%と大した変化を見せませんがK/BBでは20から10へ大きな変化を見せます。この例は極論だとしても比であることが邪魔して投手の能力を測る指標としてはK - BB%に完敗しています。

・WHIP(0.286)
WHIPも人気指標だと思います。WHIPは防御率(0.163)と違いLOB%(0.060)の不安定さをカバーできますが、BABIP(0.087)の不安定さはカバーしません。

・IFFB%(0.104), HR/FB(0.096)
この2つはFIP(0.373)やIFFIPに影響を与えますが、xFIP(0.507)があるようにHR/FBは不安定ですしIFFB%も同程度に不安定です。
fWARの構成指標IFFIPはもちろん、内野フライを特別扱いしないFIPもその実は「投手の責任範囲を絞った(から予測能力も多少ある)結果説明指標」に過ぎず、だからこそWARの構成指標として胸を張れる部分もあると思います。

・xERA(0.379)
Baseball Savantの注目度が上がるにつれxERAもよく目にするようになった体感があるので性格悪く釘刺ししておこうかなと。xERAはその名の通り、ではなく被xwOBAをERAスケールしたものであり、僕は虎の威を借る狐のように見ています。ここで言う虎は三振や四球で、狐はxwOBAcon(0.262)ですね。
xwOBAconはBABIPのように打者と投手では非対称性があります。その非対称性に対処したのがxFIPやSIERAです。
打者のxwOBAは信頼度の高い非打球要素と信頼度の高いxwOBAconで構成されていますが、投手のxwOBAは信頼度の高い非打球要素と信頼度の低いxwOBAconで構成されています。なので打者のxwOBAと投手のxwOBAを同じテンションで見るのは危険です。

・Stuff+(0.871),botStf(0.895)
ピッチモデリング指標は早い時期から安定します。wOBAcon(0.087)の不安定さと合わせて見ると4月の打球管理をもとに球質の評価を行うのは相当思い切った行為と言えそうです。

◆ vs 防御率

では5月以降の防御率との比較です。防御率は今も恐らくこれからも一番人気指標でしょうし、rWARとの結びつきも強く、個人的には重要視はしませんが無視することもできません。

対象を厳しく設定した割には小さい数字が並び、スモールサンプルの限界を感じますがピッチモデリング指標の健闘は光ります。

・xERA(0.222)
xERAがxwOBAconのせいで不安定な指標であることは先ほど述べましたが、防御率を予測する文脈においてもxwOBAconが足を引っ張ります。
4月のxwOBAconと5月以降のwOBAconの相関係数は0.155です。守備や球場が固定される影響もあるとは言え、4月のxERAのxwOBAcon部分は5月以降のwOBAconの予測に役立ちません。xERAが防御率(0.163)よりはマシな相関係数を記録できているのも三振と四球というトラッキングデータを必要としない要素によるものです。

・K - BB%(-0.282)
先ほど、K/BBのようにはバグらない指標として挙げたK - BB%ですが簡易な指標の割には防御率予測の文脈でもFIP(0.255)とSIERA(0.308)の間を取っています。K - BB%が予測指標としてもそれなりの地位を築けているのは能力依存度の高い指標であることと、三振と四球の得点価値が等価に近いこと、三振と四球以外の要素で差がつきにくいことが理由にあります。
三振と四球以外の要素は総合すると投手にとってはマイナスになります。もちろん四球もマイナスなので投手は三振 - 四球の割合をどれだけ増やすかが重要になってくるわけです。

◆ vs FIP

FIPも一応見ておきます。

当たり前ですが、投手が比較的管理できる範囲に絞っている指標なので防御率より予測はしやすくなります。

FIP予測に限らず、指標自身の信頼度や防御率予測においても打球分類を使ったxFIPやさらに投手も分類して投手ごとに加重割合を変えるような複雑な手法を取っているSIERAなどが優れているのは当然ですが、基本的なスタッツのみで算出できるK - BB%の優秀さはもう少し広まるとうれしいですね。

ちなみに今回文句ばっかり言ったxERAは防御率を記述する文脈(当該シーズンのxERA vs 当該シーズンの防御率)においては優秀です。実際に打たれたデータを使うので当然と言えば当然ですが。
優秀と言ってもトラッキングデータを必要としないFIPと記述力も変わらないですが、FIPを能力ではなく結果を表したものと見ることができるならxERAもそのような見方はでき、WARの要素にするとかはおかしいことではないと思います。DeltaGraphsはxERAに性質の近いtRAをWARの要素にしています。
(指標自体への文句というよりかは名前と機能のズレや使われ方に対する文句なので…)

∇最後に

文章がとっ散らかって質の低いnoteになってしまいましたが、結局のところ4月の成績はあてにならないです。真面目に予測するなら前年の数字の方が有用ですし、今の時代はさらに予測力の高い予測システムがいくつもあります。ただ4月の段階でも指標間に優劣はあるので全部同じように信用しないというのももったいないかなと。

4月の成績が以降の成績予測にあてにならなかろうが実際に起こったことというのも忘れてほしくないところ。得点圏で打ったなら得点圏で打ったのだし、BABIPが低かったのならBABIPが低かったのです。

あと4月の成績の信頼度を知っているセイバリストの方々もバンバン4月の成績であれこれ語ったりしてるんで、全体像が全然見えない4月だからこそ振れ幅の大きな浪漫ある考察をしていくのも楽しいと思います。

この記事が参加している募集

野球が好き

この記事が気に入ったらサポートをしてみませんか?