データに基づいた選手の評価の現在地と目的地

こんにちは、らんそうるいです。今回は5回を予定している連載の最終回として、オールインワンメトリクスの内、私たちが混合系と呼んでいるものについて書きたいと思います。連載におけるこの記事の位置づけを図で示すと次のようになります。

選手の評価指標の整理:下は個人の具体的なプレイで、上は出場選手たち(ラインナップ)の得失点差を表しています。下に行くほど具体的・上に行くほど抽象的です。

 前回(第4回)の内容をおさらいしましょう。プラスマイナス系のオールインワンメトリクスの最終進化系はRAPM(Regularized Adjusted Plus-Minus)でした。RAPMはコート上の全てのプレイを評価に含めることができる長所がある一方で、信頼できる結果が得られるまでに3〜5年分のプレイバイプレイが必要であるという短所がありました。
 今回(第5回)では、1年程度のデータでRAPMを再現しようという試みである混合系のオールインワンメトリクスを紹介いたします。よろしくお願いいたします。

オールインワンメトリクスの目的地

オールインワンメトリクスの目標の1つは、3〜5年分のデータが必要なRAPMを、1年程度のデータで再現することです。なぜRAPMがこれほどまでに重要視されているのかと言うと、コート上の全ての出来事を得失点差に押し込んでいると考えられているからです。

オールインワンメトリクスの現在地

RAPMを1年程度のデータで再現するために採られている方針は、EFF系のオールインワンメトリクスとプラスマイナス系のオールインワンメトリクスを混ぜ合わせるというものです。

オールインワンメトリクスの分類:EFF系のPM(プラスマイナス)系が重なった灰色の領域が今回扱う混合系のメトリクスです。作図の都合上、混合系の領域はEFF系やプラスマイナス系に比べて面積が小さくなっていますが、最近のオールインワンメトリクスの開発の中心は混合系で、種類も豊富です。

 単純に既存のEFF系のメトリクスとプラスマイナス系のメトリクスを混合するだけではなく、それぞれの成分を改良する試みも並行して行われています。たとえば、PIPM(Player Impact Plus-Minus)という混合系のメトリクスではプラスマイナス系の成分に改良が加えられています。PIPMではプラスマイナス系の成分としてネットプラスマイナス(連載の第4回を参照してください)が使われているのですが、選手個人ではコントロールできない運の要素を調整する処理(=ラックアジャストメント)が施されています。
 また、LEBRONというPIPMの後継に当たるメトリクスでは、EFF系の成分にも改良が加えられています。それはかさ増し(padding)という処理で、選手のポジションをデータから推定したあとに、選手個人のデータをポジションごとのデータでかさ増しするというものです。
 ラックアジャストメントもかさ増しも、短期間のデータから安定した計算結果を得るための処理であると整理することができます。

目的地までの経路

最後に集計されているスタッツの種類の増加が、データに基づいた選手の評価に与える影響について考えたいと思います。
 近年、集計されているスタッツの種類が飛躍的に増えています。NBA公式ホームページで公開されているスタッツには、トラディショナル(=ベーシック)・アドバンスドスタッツ以外の様々なスタッツが含まれています。
 集計対象のプレイが増えることで真っ先に影響が現れそうなのは、EFF系のオールインワンメトリクスの性能の向上です。EFF系のメトリクスはプラスマイナス系のメトリクスとは違って、集計されたプレイしか考慮できません。もし集計されるプレイが増えるとしたら、これまでEFF系のメトリクスでは評価が難しかった守備やオフボールのプレイが評価に取り込むことができるかもしれません。

EFF系の進化の概念図:スタッツに囲まれている領域が集計されているプレイ全体を表します。EFF系に囲まれている領域は集計されているプレイの内、EFF系の計算に使われているプレイを表します。したがって、EFF系の領域はスタッツの領域よりも大きくなることはできません。選手の貢献に囲まれた部分は得失点差に関わるプレイ全体を表します。灰色の領域は得失点差に関わるものの、まだ集計されていないプレイです。記録されるプレイが増える=白色の領域が増えるとEFF系の領域が大きくなる余裕ができ、選手の貢献全体の内EFF系のメトリクスで評価できるものが増えます。

 こうしたスタッツの種類の増加はEFF系のオールインワンメトリクスの性能向上を通じて、混合系のオールインワンメトリクスの性能を向上させてくれるでしょう。


この記事が気に入ったらサポートをしてみませんか?