データに基づいた選手の評価の現在地と目的地
こんにちは、らんそうるいです。今回は5回を予定している連載の最終回として、オールインワンメトリクスの内、私たちが混合系と呼んでいるものについて書きたいと思います。連載におけるこの記事の位置づけを図で示すと次のようになります。
前回(第4回)の内容をおさらいしましょう。プラスマイナス系のオールインワンメトリクスの最終進化系はRAPM(Regularized Adjusted Plus-Minus)でした。RAPMはコート上の全てのプレイを評価に含めることができる長所がある一方で、信頼できる結果が得られるまでに3〜5年分のプレイバイプレイが必要であるという短所がありました。
今回(第5回)では、1年程度のデータでRAPMを再現しようという試みである混合系のオールインワンメトリクスを紹介いたします。よろしくお願いいたします。
オールインワンメトリクスの目的地
オールインワンメトリクスの目標の1つは、3〜5年分のデータが必要なRAPMを、1年程度のデータで再現することです。なぜRAPMがこれほどまでに重要視されているのかと言うと、コート上の全ての出来事を得失点差に押し込んでいると考えられているからです。
オールインワンメトリクスの現在地
RAPMを1年程度のデータで再現するために採られている方針は、EFF系のオールインワンメトリクスとプラスマイナス系のオールインワンメトリクスを混ぜ合わせるというものです。
単純に既存のEFF系のメトリクスとプラスマイナス系のメトリクスを混合するだけではなく、それぞれの成分を改良する試みも並行して行われています。たとえば、PIPM(Player Impact Plus-Minus)という混合系のメトリクスではプラスマイナス系の成分に改良が加えられています。PIPMではプラスマイナス系の成分としてネットプラスマイナス(連載の第4回を参照してください)が使われているのですが、選手個人ではコントロールできない運の要素を調整する処理(=ラックアジャストメント)が施されています。
また、LEBRONというPIPMの後継に当たるメトリクスでは、EFF系の成分にも改良が加えられています。それはかさ増し(padding)という処理で、選手のポジションをデータから推定したあとに、選手個人のデータをポジションごとのデータでかさ増しするというものです。
ラックアジャストメントもかさ増しも、短期間のデータから安定した計算結果を得るための処理であると整理することができます。
目的地までの経路
最後に集計されているスタッツの種類の増加が、データに基づいた選手の評価に与える影響について考えたいと思います。
近年、集計されているスタッツの種類が飛躍的に増えています。NBA公式ホームページで公開されているスタッツには、トラディショナル(=ベーシック)・アドバンスドスタッツ以外の様々なスタッツが含まれています。
集計対象のプレイが増えることで真っ先に影響が現れそうなのは、EFF系のオールインワンメトリクスの性能の向上です。EFF系のメトリクスはプラスマイナス系のメトリクスとは違って、集計されたプレイしか考慮できません。もし集計されるプレイが増えるとしたら、これまでEFF系のメトリクスでは評価が難しかった守備やオフボールのプレイが評価に取り込むことができるかもしれません。
こうしたスタッツの種類の増加はEFF系のオールインワンメトリクスの性能向上を通じて、混合系のオールインワンメトリクスの性能を向上させてくれるでしょう。
この記事が気に入ったらサポートをしてみませんか?