KBO推定XwOBAと推定XwOBACONの紹介

要約

KBOwizardの大きな特徴の1つは、KBOの試合からchart化した打球dataを見る事ができる事。Ground ball%(GB%)やLine drive%(LD%)も打球方向dataも、大量の結果baseのdataがあります。

KBOの打球を約5,000個chart化したが、KBO wizardに新しい打球機能が搭載された。推定xwOBA(ExwOBA)と推定xwOBACON(ExwOBACON)。

wOBA(加重出塁率)とは、あるbatterがチームの攻撃的performanceにどれだけ貢献したかを、起こりうる結果ごとに重み付けして測定しようとするものです。
xwOBAは、一歩進めて、contactの質と類似の打球のperformanceを調べます。Baseball SavantのxwOBAの計算式は公開されていませんが、出口速度(EV)、発射角度(LA)、sprint speedの組み合わせである事は分かっています。

KBOからcontactの質を測定しているので、もう一つの評価手段としてEstimated xwOBAをKBO Wizardに取り入れたいと考えました。この記事では、私がEstimated xwOBAの計算に至った経緯と、KBO wizardでの適用方法について説明します。

STEP 1: wOBA Weights

wOBAの計算は比較的簡単ですが、各結果に対するウェイトが必要です。MLBのウェイトはここで見つける事ができます。KBOのウェイトについては、FanGraphsがLeaderboardで算出したKBOのwOBA値から逆算しています。

KBOの基本統計とKBOの詳細統計のCSVを読んだ後、私はwOBA関数を、6つの未知の変数が与えられた時に、Rで解く事ができるものに方向転換する必要がありました。基本的な代数学を使って、各 playのwOBA値に対して分母を掛け合わせました。そこから、1つの変数としてwOBAの構成要素、結果としてdenom*wOBAの行列を作成し、limSolveパッケージのSolve関数でRに魔法をかけさせました。

完璧に動作し、このようなwOBA weightが出来上がりました。

リーグ wBB wHBP w1B w2B w3B wHR
kbo 0.747 0.823 0.928 1.242 1.666 1.942

STEP2:BBEタイプ別の推定xwOBAを算出する。

次に、どのような種類のballをどのような強さで打ったかで、推定xwOBAがいくらになるかを考えてみます。ここで、私のdataの制約が出てきます。Truckmanのようなrobot追跡systemではなく、人間である私は、3つの打球の変数しか記録していません。contact(ハード、ミディアム、ソフト)、打球の種類(Ground ball, fly ball, line drive, pop-up)、方向(pull、straight、逆方向)。

xwOBAについては、コンタクトの強さと打球の種類だけで計算することにしました。

まず、コンタクトと打球のコンボごとに、すべての打球結果(1B、2B、3B、HR、FO、GO)がどの程度発生するかを計算しました。そして、その出現率に前述のwOBAの重み(アウトは0と数える)をかけ、各コンボの加重平均wOBA値を返した。

さて、これらの値から興味深いことがわかります。ハードヒットとミディアムラインドライブがトップで、ハードヒットフライボールが3位です。しかし、4番目に高い推定xwOBA値はソフト・ライン・ドライブに属しており、これは直感に反しているように思えます。しかし、これは理にかなっている。私の計算では、KBOでは23のソフトヒット・ラインドライブがあり、そのうち14がシングル(61%)に落ちている。外野に飛ばすには十分なパワーがあるが、簡単に捕れるほど強くは打てないということだ。BBEイベントの総数に比べれば、このように少ない数なので、ソフトに打ったラインドライブの価値は、推定xwOBAの値にあまり影響を与えないでしょう。

少なくとも、2位から最下位までは、xwOBA推定値0.095で、Soft hit pop-upの下となる。この値も直感に反しているように思えますが、Fly ballの90.3%がFly outになるのに対し、Line driveや強打のフライボールはヒットになる確率が高くなります。このような背景から、外野手にとっては簡単な playであるため、低い数値も納得がいく。

WALKは0.747推定xwOBA、Hit by pitchは0.823、三振は0.000の値が割り当てられています。

STEP3: 応募する xwOBA

まず最初に、FanGraphsのwOBAと私の推定xwOBAとの比較を見てみましょう。答えは?あまり良くないですね。

両者の間には若干の上昇傾向が見られるものの、r2乗の値が0.2844であることから、そこにはあまり相関がないことがわかります。これは率直に言って、ここで使われたデータの違いから予想されたことです。FanGraphsのデータはKBOの全シーズンのものであるのに対し、私のデータは6月以降のもので、全試合・全出場・全打席をカバーしているわけではありません。そのため、この比較に使用できる選手は58人しかいませんでした。この不完全なデータが問題となるのは、イ・ジョンフとロベルト・ラモスという2人の顕著な異常値を見ることができるからだ。この大きな違いは、彼らのBBEプロファイルと、先ほどお話しした各接触打球のコンボの値との相互作用に起因しています。

選手 xwOBA xwOBACON SwStr% GB% FB% LD% PU% Soft% Med% Hard% (注)1.
イ・ジョンフ 0.506 0.521 2.4 24.6 32.8 36.1 6.6 13.1 31.1 55.7
ロベルト・ラモス 0.263 0.433 16.3 40.7 25.9 22.2 11.1 18.5 37 44.4

打球の種類と接触頻度ごとに相関を調べ、Estimated xwOBAとの関係を見ることにしたところ、より予想通りの結果になりました。(ボールをHARDに打つのは良いことだ)。

ここから、Hard hit率とLD率が推定xwOBAの2大指標であり、Soft contact率、GB率、SwStr率(K%の代理)が推定xwOBAを最も引き下げる(投手にとって最も良い)ことがわかる。イ・ジョンフとロベルト・ラモスの例で説明すると、推定xwOBAと推定wOBAに大きな差があるのは、このためです。

リーはハードラインのドライブを多く打ち、SwStr%はわずか2.4%とKBOでも屈指のcontact hitterです。一方、ラモス(BBE profile)だが、SwStr%は16.3%とKBOで最も高い部類に入る。アーロン・ブルックスのチェンジアップが、GB率90%、ソフトコンタクト率49%にもかかわらず、球種別xwOBAが10位であるのは、三振が含まれているためである。

打撃面では、イは三振率の低さからEstimated xwOBAではリード差でトップだが、Estimated xwOBACONではナ・ソンボム、メル・ロハスJrと数ポイント差でかろうじてトップだ。NC出身のパク・ミヌは4位と意外だが、こちらもボールを柔らかく打つことはほとんどなく、SwStr%の低い打者である。

投手では、アーロン・ブルックスが推定xwOBAで0.253、推定xwOBACONで0.288とトップで、推定xwOBA、推定xwOBACONともに上位10球中3球を持っています。不完全で欠点がないわけではないが、この文脈での推定xwOBA、推定xwOBACONは、私たちが予想したことを、いくつかのサプライズとともに教えてくれるものであり、これは良い指標となるものである。

要するに、Estimated xwOBAはあらゆる結果を包含し、Estimated xwOBACONはコンタクトの質を測るのに役立つでしょう。

この記事が気に入ったらサポートをしてみませんか?