アダム・ダン率を再定義する
大谷翔平
大学在学中に済ませておかなければならないことはあらかた済まし、あとは卒業論文に取り組むのみですが、どうも腰が重くてかないません。
卒論から逃げるなら逃げるで、ずっと憧れのあった楽器にチャレンジしてみるとか興味のある授業に潜ってみるとか有意義な時間の過ごし方はいくらでもあるわけですが、そういった気概もなく、結局だらだらとインターネットに興じています。私は野球と政治家が好きです。
インターネットはたいへん優れているので、これに興じていると日々予期せぬ新たな発見があります。例えば最近では、今シーズン活躍の著しい大谷翔平選手のレビューを見ていたところ、MLBがどうやらあらゆる選手のかなり詳細な成績やデータを公開しているらしいということを発見しました。
このデータの数字をいじって少しばかり遊んでみたのですが、その後どうにも空しくなったため、この初めて使う媒体に備忘録として残しておこうと思います。テーマは私の大好きな打撃指標の「アダム・ダン率」です。野球フリークの方はご一瞥頂けますと幸いです。
Richard A. Lancellotti
ランス、という呼称であればご存じの方も多少いらっしゃるかもしれません。このイタリア系アメリカ人は1987年に来日し、広島東洋カープの助っ人としてホームラン王を獲得したものの、翌年の1988年シーズンを終えた後にわずか2年の契約を終えて嵐のように去っていきました。
小学校の低学年くらいのころ”カープ 助っ人外国人列伝”みたいな映像の中で見た、ホームベースに倒れ込むようなスイングから放たれるホームランと彼を紹介する際の「三振かホームラン」というフレーズに如何ともしがたい興奮を感じたことを覚えています。
ところで、千鳥の大吾さんが高校に入ってすぐの頃、ソフトボール大会でバットを振り回して大袈裟に構えた際に、「ドミニカ出身か!」とレフトからツッコミを入れたのがノブさんだったという話はあまりに有名です。
ここで注目したいのは、彼らの間で、”助っ人外国人(特に黒人)というのは大袈裟なバッティングフォームからおよそ日本人らしくない鋭い打球を放ち、反面三振も多い”、というイメージがおそらく共有されていたということです。あえて明言するまでもありませんが、こうしたイメージから彼らは外国人助っ人を蔑んでいたわけではありません。むしろ彼ら(そして多くの野球ファン)は外国人助っ人のこうした側面に対して、私がランスに対して感じたのと同じように、単純な憧れとも羨望とも違う、いわばロマンを感じていたのではないかと察するわけです。
そしてこのロマンの探求こそ、今回のテーマの「アダム・ダン率」成立の一義的な要因であり、またこの指標が説明せんとするものの中で大きなウェイトを占めているのです。
Adam Dunn
私が野球の掲示板というものに初めて触れたのは、母親にiPod touchを購入してもらい、晴れて親の監視のもとを離れてインターネットに興じることができるようになってから1年ほど経った2012年だったと記憶しています。そして、運命的にもその2012年は今回の主役であるアダム・ダンが最もアダム・ダンらしい成績を上げた年でした。
ホームラン数はこの年三冠王を獲得したミゲル・カブレラと3本差の41本でこれは両リーグ通じて5位の立派な成績であり、また史上50人目の400本塁打を記録しましたが、圧巻なのは三振です。三振率(=三振/打席数)は.342で2位のペドロ・アルバレスに対して.035の大差をつけての1位であり、222の三振に関しては両リーグ通じてダントツのトップであることはもちろん、MLB歴代を通して見ても首位と1差の2位です。
そう、2012年のアダム・ダンはまさに「三振かホームラン」的ロマンに溢れた成績を残したのです。こうしたことから、アダム・ダンは当時の掲示板のMLBファンから熱狂的な支持を獲得し、ついには”アダム・ダンらしさ”を測る指標の「アダム・ダン率」が提唱されるに至りました。
アダム・ダン率①
時空を90年代初頭のアメリカ・デトロイトに移しましょう。当時デトロイトタイガースにロブ・ディアーという選手がいました(のちに1年だけ阪神タイガースにも所属しています)。彼もまたロマンに満ちた野球選手でした。所属期間はわずか2年半程度だったものの、タイガースの公式サイトにおいてAll or nothingというタイトルの記事で紹介されていることからも彼が与えた印象の強さが伺えます。
SABRによると、インターネットの母国であり統計先進国であるアメリカではすでに90年代半ばには彼が纏うロマンとその打撃成績の統計的特異性が掲示板上で議論されており、そこではTTO(Three-True-Outcomes)%なるものが提唱されました。TTOを構成するThreeとは、
であり、TTO%は{(本塁打+三振+四球)/(打席数)}を百分率で表記する打撃指標です。私たちの先駆者たる黎明期のインターネットユーザーたちはこの指標をもってロブ・ディアーの特異性を説明しようとし、実際に彼が1991年に残したTTO%は90年代で最高のものでした。
時空を進めて2012年、この日本で先述の通りアダム・ダン率が提唱されます。
アダム・ダン率={(本塁打+三振+四球)/(打席数)}×100
約10年前に日本のMLBファンがロマンに突き動かされて作り上げた指標は、奇しくも90年代アメリカのMLBフリークが同種の感慨を抱きながら作り上げた指標と一致していたわけです。美しい話ですね。(ちなみに先述のタイガース公式サイトの記事ではアダム・ダンも言及されており、
と述べられています。)
アダム・ダン率②
さて、この冗長な文章をここまで真面目に読んでくださる方が万が一にもいらしたら、先ほどのアダム・ダン率(TTO%)の説明の中に疑問を抱いた箇所があろうかと思います。
それは、これまでロマンとは「三振かホームラン」であるというような説明であったにもかかわらず、主としてそれを測る指標であるはずのアダム・ダン率は「三振かホームランか四球」を測る指標になっている、ということです。皆さんがこうした疑問を抱く原因は、間違いなく私の説明不足にあります。
そもそも、アダム・ダン(ロブ・ディアーも、そして実はランスも)は単純な「三振かホームラン」のバッターではありませんでした。
IsoDという指標があります。これは(出塁率-打率)によって簡単に求められる打撃指標で、”四死球による出塁の多さ”の程度を表し、.100を超えると優秀であるとされています。もちろんホームランの多い打者は必然的に勝負を避けられやすくなるため、IsoDは上がりやすくなることが予想されます。しかし実際に2012年の規定打席到達者のホームランとIsoDの関係を見てみると、
以上の散布図のようになっており、また相関係数も0.296となっていることから、これらの指標の相関は非常に弱いものであることが示唆されます。その中でアダム・ダンは2012年、41本の本塁打を放ちながら.129のIsoDを記録しており、これは両リーグ通じて2位の傑出した数字です。(ちなみにランスが本塁打王を獲得した年のIsoDは.105、1991年のロブ・ディアーのIsoDは.135でした。)
こうしたことから、私(そして多くのMLBファン)にとって”アダム・ダンらしさ”とは、
「三振かホームラン」的ロマンを纏いながら四球も選ぶこともできる趣深さ
であるという風に感じられるわけです。
アダム・ダン率の問題点①
”アダム・ダンらしさ”の定義が上記であるとすれば、アダム・ダン率の算出に四球が関わることは合理的であり、そのためアダム・ダン率はアダム・ダンらしさを正確に表している。私はそうは考えません。そうは考えない理由は主に2つです。
1つ目は、本塁打・三振・四球という平均も分散も、そして持つ意味も異なる3つの指標を等価に扱っている点、より明確には四球の影響度が大きすぎる点です。
ここで、この話題に関してもう少し詳しく考察するため、1950年から2019年シーズンの規定打席到達者を対象にし、アダム・ダン率を目的変数、本塁打・三振・四球を説明変数として回帰分析を行いました。結果は以下の通りです。
アダム・ダン率は本塁打・三振・四球を等価に扱っているため、この回帰分析では「係数」はほとんど同じになりますが、着目すべきは「標準偏差」と「標準偏回帰係数」です。
これらを簡単に解釈すると、
アダム・ダン率は本塁打・三振・四球を等価に扱っているものの、標準偏差の大きさが三振>四球>本塁打となっている(つまり、選手間の成績の差は三振>四球>本塁打の順につきやすい)。そのため相対的にアダム・ダン率の大小は、本塁打より四球に、四球より三振によって規定されやすい。
と言えます。
”アダム・ダンらしさ”は上に述べたとおりであり、その内容に鑑みると、”アダム・ダンらしさ”の前提である「三振かホームラン」的ロマンは選球眼の良さに先んじるべきです。そしてその場合、本塁打・三振・四球のアダム・ダン率に与える「標準偏回帰係数」を参考にした影響の大きさ(統計的に微妙な表現ですが)の序列は、
三振≧本塁打>四球
であるべきであると考えます。
アダム・ダン率の問題点②
2つ目の問題点は、”ロマン”に対する態度です。
上表は1950年から2019年シーズンの規定打席到達者を対象にした、アダム・ダン率ランキングのTOP20です(ADP=アダム・ダン率)。
ひとまず2004年のバリー・ボンズの成績を詳しく見ていきましょう(ちなみに2004年のバリーボンズの成績は私が最も好きなシーズン成績の1つです)。例えば、この年は45の本塁打に対して三振は41ですが、40以上の本塁打を放ちかつ三振が本塁打を下回ったのは1950年以降でこの年のボンズ以外に3例しかありません(しかもその3例はすべて50年代)。さらに打率はこの年に単一シーズンの最多安打記録を更新したイチローに次ぐ2位です。この年のボンズはロマンのある打者というよりは、単に優れた打者と捉えるべきなのではないでしょうか。
もちろんこれは極端な例であり、アダム・ダンやその後継者として名高いジョーイ・ギャロ、2016年に本塁打と三振の二冠を達成したクリス・カーターなどロマンに満ちた選手も多々ランクインしています。一方で、先述のバリー・ボンズをはじめとして、2018年に殿堂入りを果たしたジム・トーミなどの往年の名選手もランクインしています。また、半数以上の12人が打率.250を超えています。
ここで再確認したいのは、「三振かホームラン」的ロマンは必ずしも優れた結果を伴わないことであり、むしろ最高とは言えない成績を残すことがロマンを纏うためには必要不可欠であるとすら思うのです。思い出してみれば、今回私がロマンある成績の例として挙げた成績の中の打率はすべて.220を下回るものであり(ランス1987:.218、ディアー1991:.179、ダン2012:.204)、そもそもアダム・ダンはシーズン打率.266をマークしたことがあるにも関わらず、私を含む野球ファンはその年の成績には目もくれません。
よって、
アダム・ダン率はその性質上、非常に優秀な打者であれば本塁打や四球でその値をある程度高めることができ、しかもそうした単なる優秀な打者を除外していく仕組みを持たない
このことが、アダム・ダン率の2つ目の大きな問題点であると考えるわけです。
以上のアダム・ダン率の問題点に関する議論を要約し、
目標①アダム・ダン率への影響度を三振≧本塁打>四球にする
目標②ただの優秀な打者を評価しない
この2点の達成を目指すことで、より”アダム・ダンらしさ”を正確に描写するアダム・ダン率を再定義していきたいと考えます。
アダム・ダン率を再定義するにあたって
wOBAという指標があります。日本ではまだまだメジャーではないですが、MLBでは現在最も重視されている指標の1つであり、以下のように算出されます。
勘のいい方は分かるかもしれませんが、これはOBP(出塁率)や近年日本でも流行っているOPSの改良版です。OBPは単打や長打を過小評価し、OPSは四球を過小評価する傾向があるため、四球・死球・安打等の得点貢献度合いを適当に評価するべく係数調整がなされています。ちなみに、係数の比率はシーズンによって微妙に異なり、各係数は最終的なwOBAが出塁率と同じ感覚になるようなスケールに設定されています。スタッツを眺めていると、こうした係数調整を非常によく目にします。
ところで、これは完全に個人的な嗜好ですが、私はこうした係数調整があまり好きではありません。覚えてらんないからです。例えば今回アダム・ダン率を再定義するにあたって、先述の目標①だけを達成するのであれば単純に係数調整を行えばよいのですがですが、今回の再定義はこの個人的嗜好に従い、
手順1 ”アダム・ダンらしさ”に則りつつ、目標②の解決を目指した式を作成する。
手順2 その式が目標①②を達成していれば採用する。
といった段取りで行いたいと思います。
アダム・ダン率を再定義する①
アダム・ダンらしさとは、
「三振かホームラン」的ロマンを纏いながら四球も選ぶこともできる趣深さ
でした。今回は選球眼を評価する指標としてはBB%(=四球/打席数)を用いたいと思います。先ほどは紹介もかねてIsoDを使用しましたが、セイバーではBB%を使用することが圧倒的に多く、また1つの割り算だけで行えるので式がすっきりするためです。
こうしたことから修正アダム・ダン率(redefined-ADP)をひとまず、
rADP = Ri (Romance index=ロマン指数) + BB%
と定義します。
次に、”「三振かホームラン」的ロマン”の大きさを示すロマン指数を定義していきます。まず「三振かホームラン」をさらに噛み砕き、「安打に占める本塁打の割合が高く、かつアウトに占める三振の割合が高い」と解釈します。これを式に表しRi*を、
Ri* = HR/H + SO/{(1-OBP)*PA}
以上のように定義します。ここで、「アウトに占める三振の割合」を式にする際に”アウト数”を {(1-OBP)*PA} と簡易的に表現しましたが(OBP=出塁率、PA=打席数、SO=三振)、正直複雑すぎるためさらに簡易的に表したいと思います。
Ri** = HR/H + K%
K%はSO/PA(SO=三振、PA=打席数)で表される、いわば三振率であるため、厳密には「アウトに占める三振の割合」を表現したものではありません。しかし、K%と SO/{(1-OBP)*PA} の関係は、
上の散布図の通りであり、さらには相関係数も0.988と極めて高いため、代理変数としてK%を用いることには相当の妥当性があるのではないかと考えます。
最後に、アダム・ダン率の問題点②での考察より、単なる優れた打者を取り除くための操作を行います。候補は2つあり、1つ目はアダム・ダン率の問題点②でも触れた打率の値をRi**から引くことです。打率の高すぎる打者はロマン指数が低くなります。
Ri1 = Ri** - AVG = HR/H + K%- AVG
(HR=本塁打、H=安打、K%=三振率、AVG=打率)
2つ目の候補は同様の操作を長打率を用いて行うことです。長打率は塁打数を打数で割った値であり一般に長打力を図る際に用いられる指標です。しかし今日においては、純粋な長打力を図る際にはIsoPという(長打率)-(打率)で求められる指標が用いられる場合が多いです。高い長打率を残せるということは、長打力を発揮しながら安定したアベレージを残せる好打者であることの証左であり、これはまさにアダム・ダン率が本来カバーすべきでないにも関わらず評価してしまう打者の筆頭であるわけです(下図のG)。
こうしたことから、ロマン指数の2つ目の候補を
Ri2 = Ri**- SLG = HR/H + K% - SLG
(HR=本塁打、H=安打、K%=三振率、SLG=長打率)
と定義します。
以上の議論より、修正アダム・ダン率の候補を
rADP1 = Ri1 + BB% = HR/H + K% - AVG + BB%
rADP2 = Ri2 + BB% = HR/H + K% - SLG + BB%
の2つに絞りたいと思います。
注)K%、BB%は百分率で表現されるケースが多いですが、今回の投稿においてはすべて割合のまま計算に用います。
アダム・ダン率を再定義する②
さて、アダム・ダンとの素敵なひとときもいよいよ佳境に差し掛かってきました。まず、rADP1を目的変数、本塁打・三振・四球を説明変数として回帰分析を行ってみましょう。分析対象は1950年から2019年の規定打席到達者です。
先ほどはしっかりとは説明をしませんでしたが、少しだけそれぞれの用語の意味を確認していきましょう。
「係数」ー その項目が1増加したときに、目的変数がどれだけ増えるかを意味します。(例えば本塁打の係数は約0.0037ですが、これは本塁打が1増えるごとにrADP1が0.0037増加することを意味します。)
「平均」ー その項目の平均値です。
「標準偏差」ー その項目のデータのばらつきを表します。
「標準偏回帰係数」ー 標準偏差の大きさに応じて重みづけした係数です。(標準偏差が大きい項目ほど値の差が付きやすいため、目的変数の決定要因となりやすいです。ひとまずはそうした要素を加味した影響度としてとらえてください。)
「標準誤差・t・P値」ー これらは係数等の正確性に関する指標ですが、今回は正確性に疑問を呈す値ではなかったため解説は飛ばします。
まずは「係数」を見てみましょう。
本塁打>三振>>四球となっており、従来のADPではこれら3つが等しくADPに寄与していたことに鑑みると、かなり理想的なバランスで重みづけを行えています。
次に「標準偏回帰係数」です。アダム・ダン率の問題点①では、本塁打・三振・四球の影響度の序列は三振≧本塁打>四球であるべきであると述べましたが、きちんと三振>本塁打>四球の順になっています。三振と本塁打の差が少し大きすぎる気はしますが、概ね当初から目指した形に落ち着いています。
rADP2で同様に回帰分析を行いました。感想は大体同じです。「標準偏回帰係数」に注目すると本塁打と三振の係数の差がこちらの方が少し小さく、多少当初の理想に近いかなと感じます。
以上の考察より、rADP1とrADP2はどちらも目標①の達成は果たせていると考えます。
次に1950年から2019年までの規定打席到達者のrADP1とrADP2ランキングTop20を見てみます。
アダム・ダン率の問題点②でも触れた打率に注目すると、ADPのランキングでは半数以上の12人が.250を超えていましたが、rADP1のランキングでは6人、rADP2のランキングでは1人しか超えていません。
スラッガーの総合指標であるOPSに注目すると、ADPのランキングの平均値が.968であったのに対し、rADP1のランキングでは.891、rADP2のランキングでは.765となっています。
一方で、表には表示されていませんが先ほど少し触れたIsoP(純粋な長打力を示す指標)に注目すると、rADP1のランキングでは19人が、rADP2のランキングでは16人が.200(これを超えれば優秀とされます)をきちんと超えています。
これらのことは、打者としての総合的な能力は(ADPで評価される打者)>(rADP1で評価される打者)>(rADP2で評価される打者)の順に高いですが、どの指標に評価される打者も純粋な長打力には優れていることを示唆しています。
また上表は各指標Top20の打者の本塁打・三振・四球の標準偏差の対応表であり、ほぼすべてで標準偏差の大きさがrADP2<rADP1<ADPとなっています。このことは本塁打・三振・四球に関して、ADPよりもrADP1、rADP1よりもrADP2が似た特性を持つ打者を評価することを示唆します。
さらに選手名に注目すると、rADP1のランキングでは先述のボンズをはじめとして、ステロイドエラのヒーローであるマーク・マグワイヤやヤンキースのスターであるアーロン・ジャッジもランクインしています。
それに対してrADP2のランキングでは、そういった”単に優れている打者”のランクインは見られませんが、その一方で本塁打が30本を下回る打者もランクインしています(しかし、彼らの成績やプレースタイルを見るとかなりアダム・ダンに通ずるものを感じます)。そして、なんと言ってもrADP2のランキングではアダム・ダンが1位にランクインしています。
ランキングを概観した結果、主に以下の3点が言えると考えます。
・どちらのrADPも目標②を相当程度達成している。
・その程度はrADP2の方がrADP1より大きい。
・しかしrADP2の優秀な打者の除外は行き過ぎている感もある。
結論としては、どちらのrADPも当初想定していた程度にアダム・ダン率をアップグレードできているように思います。また、どちらがより”アダム・ダンらしさ”を表現できていると考えるかはかなり個人の嗜好に依存するように思います。rADP1がワーキャー、rADP2が玄人ウケといった感じでしょうか。そこで、アダム・ダン率を再定義するにあたっての最後で述べた手順に則り、どちらも修正アダム・ダン率として採用し、
rrADP(radical redefined-ADP) = rADP2 = HR/H + K% - SLG + BB%
mrADP(moderate redefined-ADP) = rADP1 = HR/H + K% - AVG + BB%
をここで改めて提唱したいと思います。
修正アダム・ダン率の目安
打率.300。これは最も有名な”良い打者”の基準です。実際、世界のホームラン王たる王貞治さんが30本の本塁打を放ったにもかかわらず1980年にバットを置いたのは通算打率を.300に乗せるためだったともいわれています。
ところで下図は、1950年から2019年の間に規定打席に到達した打者の打率と長打率のヒストグラムと箱ひげ図です(外れ値は一部表示されていません)。
打率と長打率の第三四分位数(上から数えて25%の位置にある値)は.295と.484ですから、一般に知られている好打者の証である打率.300と長打率.500はかなり妥当性のある値であることが分かるわけです。
上図はrrADPとmrADPのヒストグラムと箱ひげ図です(外れ値は表示されていません)。打率・長打率と同様に、”第三四分位数を少し上回るキリの良い値”を超えることがその指標で優れていることの目安であるとすると、
rrADP > .000
mrADP > .200
を満たせば、その打者は”アダム・ダンらしさ”に秀でているということができます。
アダム・ダンのrrADPは.408で、基準となる.000を大きく超えています。また、アダム・ダンのrrADPの偏差値は101であり、かなり突出したアダム・ダンらしさを備えていることが分かりますね。
ロマン
この数日、Baseball Savantのデータをポチポチといじってアダム・ダン率の再定義を試みていたわけですが、このことで野球界に何かを与えられたかと考えると、まあそんなことはありません。むしろ、純粋に優れた打者を意図的に排したこの指標で打者を評価することは、プロの打者に対して侮辱的な、すべきでないことだと捉えられるかもしれません。
ですが、私のようなしがない大学生に10000字のnoteを書く情熱を与えるほど魅力的な何かこそロマンであり、それを纏うアダム・ダンや”アダム・ダンらしい”打者の存在はMLBや野球そのものの魅力を高めているわけです。今回の試みでは、一般的な指標ではなかなか評価されることのないそういった価値を素人なりに捉えようとしたのでした。
最後に、私の長文・駄文・浅学に耐えてここまで読んで下さった方がいらしましたら、本当にありがとうございました。皆さんの明日にロマンのあらんことを。
この記事が気に入ったらサポートをしてみませんか?