見出し画像

Fantasy Baseball ドラフト前成績予測

はじめに

過小評価されている選手を安価で獲得する。
2000年代、オークランド・アスレチックスのゼネラルマネージャー、ビリー・ビーンはそうしてチームを勝利に導いた。マネーボールである。
当時セイバーメトリクスとして脚光を浴びた統計学は、現在では全球団が用いる一般的な指標となった。そしてStatcastなどトラッキングシステムを取り込み更なる発展を遂げている。
Fantasy Baseballは現代のビリービーンを目指すゲームだ。しかし当時のように出塁率やOPSを見れば勝てるわけではない。星の数ほどある指標から、Fantasy Baseballで勝つためにどれを見ればいいか、自分流のやり方を書いていきたい。


ドラフト前の成績予測 野手編

結論:xwOBA、Sprint Speed、守備率

おはDリーグ2024の野手対戦項目は、安打数、二塁打数、本塁打数、得点、打点、打率、出塁率、盗塁数、守備率、補殺、満塁弾の全11項目である。それぞれの予測には何の指標が必要であろうか。

①本塁打数

出典:Fangraphs

上の表は1955-2012年のMLBの指標ごとの年次相関である。
HR/PA(本塁打/打席数)は0.785と高い相関を認めるため信頼できる。よって、本塁打数の予測は、HR/PAを見れば良い。

②出塁率
OBP(出塁率)は0.632と比較的信頼できるが、uBB/(PA-HBP-IBB) 非故意四球/(打席数-死球-故意四球)は0.781とさらに相関が強い。出塁率は打率+四球率+その他であり、打率の相関の低さが足を引っ張る形となっている。打率を精度高く予測できれば、出塁率の予測精度も上がりそうだ。

③安打数、二塁打数、打率
年次相関はAVG(打率)が0.477、2B/PAが0.455であり、信頼できない。直接の予測は難しいため、迂回経路を探す必要がある。
打率の定義は安打数/打数であり、安打には本塁打とインプレー安打がある。インプレーになった打球のうち安打の割合を示すのが、BABIPである。打者BABIPは年次相関0.463と一定の相関があり、完全な運任せとは言えない。過去の研究から、BABIPの高い野手には以下の特徴がある。
・打球が速い
・打球の角度がいい
・足が速い
このうち打球に関してはxwOBAconという指標でまとめられる。これはstatcastの打球データ(速度、角度など)から、打球あたりの得点創出を価値づけしたものである。この指標が高ければ価値の高い打球を打っているということだ。

出典:Namiki氏のnote

この表は2015-2020年のMLBのstatcastデータの年次相関である。xwOBAconは0.76と信頼できる。
また足の速さはSprint Speedというデータが公開されている。年次相関を計算した研究は存在しないが、1年で極端に足が遅くなることはないだろう。
よって、インプレー安打数はxwOBAconとSprint Speedを見れば予測できる。
最後に、インプレー打球や本塁打を増やすためにはそもそもバットにボールを当てる必要があり、三振数が少なければ良い。SO/PA(三振数/打席数)は0.868と信頼できる。
以上から、打率の予測にはxwOBAcon、Sprint Speed、SO/PAが使える。

①-③のまとめ
ここまで予測に必要な指標としてHR/PA、uBB/(PA-HBP-IBB)、xwOBAcon、Sprint Speed、SO/PAを挙げた。しかし5つも指標を見て比較するのは手間であり現実的ではない。これらをまとめたちょうどいい指標がある。
それがxwOBAである。
期待されるwOBAを表す指標であり、xwOBAcon、四球、三振の全てを含む。(本塁打はもともとxwOBAconに含まれる)
ただしこれは足の速さを評価しないため、Sprint Speedだけは個別に見る必要がある。

④得点、打点、満塁弾 
個人の能力に加え前後の打者が影響するため、予測する意義は薄い。打線が強いチームなら有利程度である。

⑤盗塁数
年次相関のデータは存在しない。Sprint Speed、前年の盗塁数を参考にする。

⑥守備率、捕殺数
こちらも年次相関のデータが見つからなかった。コンバートがなければ前年度を参考にすればよいかと思われるが、そもそも捕殺はボールが飛んでこなければ成立しない。本人の能力以外の部分が大きく、年次相関は高くないと予想できる。捕殺は無視し、守備率だけを見れば良いと思われる。

結論
11項目を予測するためには、HR/PA、uBB/(PA-HBP-IBB)、xwOBAcon、Sprint Speed、SO/PA、守備率を見ればよいが、指標が多すぎる。xwOBA、Sprint Speed、守備率だけを見るのが、予測精度と簡便さのバランスが取れているのではないだろうか。


ドラフト前の成績予測 投手編

結論:xFIP

おはDリーグ2024の投手対戦項目は、イニング数、奪三振数、QS、完投数、被弾数、リリーフ登板数、セーブ+ホールド数、リリーフ勝利数、防御率、WHIP、K/BBの11項目だ。順番に見ていく。

出典:Fangraphs

①イニング数
週の先発数が大きく関わるので、1人あたりのイニングを予測する意義は薄い。

②奪三振数、K/BB
SO/9(9イニングごとの奪三振数)の年次相関が0.829と高いため信頼できる。
K/BBも0.674と悪くはないため、そのまま前年のものを見るといいだろう。

③QS、完投数
QSは防御率を予測すればよい。打たれなければ6イニングは投げるだろう。
完投数は運だ。

④被弾数
HR/9は0.470と信頼できない。
では打球系の他の指標はどうだろうか。

出典:Namiki氏のnote

wOBAconやBarell%、HardHit%など、ホームランに関わっていそうな指標は軒並み年次相関が低い。
これはセイバーメトリクス黎明期から言われている、「投手は打球の行方をコントロールできない」の根拠となる現象だ。
ただしその真逆の現象も確認されている。

出典:Fangraphs

GB%(ゴロボール率)、FB%(フライボール率)がともに80%以上の年次相関を認めるのだ。投手によってゴロを打たれやすいかフライを打たれやすいかは決まっているらしい。投手は打球の行方をコントロールできないのではなかったのか。
ちなみにFB%の低い投手を取れば被弾数を減らせるのでは、と思うかもしれないが、残念だがそうはならない。

出典:Fangraphs

先ほどの表の続きだが、HR/FB(フライに占めるホームランの割合)は年次相関-0.029と全く関係が見られない。フライ数からホームラン数を予測するのは諦めよう。
以上から、投手の被弾数を予測するのは不可能だ。

⑤防御率、WHIP
防御率は0.373、WHIPは0.430と年次相関が低いため予測は難しい。
そもそも防御率を構成する要素には、投手本来の実力に加え、バックの守備力や得点圏で打たれるかどうかという本人の実力と関係ない部分が含まれる。
ここはセイバーメトリクス古来からの伝統に則り、インプレーは投手の責任ではないとして、三振、四球、被弾のみを見たほうが良いだろう。
年次相関はFIPが0.584、xFIP(FIPの被弾要素のブレが大きいためフライに占めるホームランの割合を一定に固定したもの)が0.699。xFIPなら予測に使える
ちなみにtRAはここにインプレー要素を足したもの(インプレー打球が理想的な飛び方をするものと仮定して算出)であるが、年次相関は0.589とやはり下がる。Fangraphsが独自に算出しているSIERAという指標も存在するが、算出方法がtRAとそう変わらないので年次相関もxFIPには勝てないだろう。
よって、xFIPで三振、四球、被弾だけを予測し、防御率、WHIPは運を天に任せるしかない。たまたま打球が野手の正面へ飛び(低BABIP)、得点圏で打たれない(高LOB%)となることを祈ろう。

⑥リリーフ登板数、リリーフ勝利数
運。

⑦セーブ+ホールド数

2023年セーブランキング
2023年ホールドランキング

上の表は2023年のセーブランキングとホールドランキングだ。
読み取るべきことは2つ
・セーブ数はホールド数より多い
・強いチームのセーブは必ずしも多くない
以上から、個人能力の高いクローザーから取っていくのが基本戦略となるであろう。ここでもxFIPが役に立つ。
また、そのままセーブ+ホールド数を予測してくれているサイトも存在するので参考にするのもよい。

●結論
投手の成績は野手と比較して難しい。ある程度のブレが生じるのを前提として、xFIPを見て獲得するのが現状の最適解ではないだろうか。


成績予想サイトについて

どの業界にもプロがいるもので、MLBにも成績予測のプロが存在する。
Fangraphsだけで、ZIPSやSteamer、ATCなど6種類が掲載されており、また有料サイトとしてPECOTAなどが存在する。
一番評判がいいのはこのPECOTAなのだが、課金しないと見られないので使ったことがない。
誰か使ったら的中度合いを教えてださい。

ちなみに予測サイトの結果を比較する催しもよく行われており、去年はATCが一番正確だった様子。
基本的にはどの予測も過去3年の成績を加重平均して、年齢による成長や衰えなどを加味して算出しているようだが、リンク先を見て貰えばわかるように、ATCでも的中率は微妙。
やはり未来の正確な予測は難しい。


4000字を超えてしまったので、記事を分割し、後編は別記事とする。
後編はシーズン開幕後、打席数が少ない時点でどう年間成績を予測するかを書いていきたい。

参考文献





この記事が気に入ったらサポートをしてみませんか?