見出し画像

PIPM (Player Impact Plus-Minus)

原文: Introducing Player Impact Plus-Minus 
*英語が読める方は原文推奨です。

概要

PIPM (Player Impact Plus-Minus) は、Jacob Goldsteinが作った、オールインワンメトリクスと言われるものの一つです。NBAでは、PIPMの他にもLEBRONESPNのRPMFiveThirtyEightのRAPTORなど、様々なインパクトメトリクスが一般公開されています。これらの目的は、選手が試合に与えるインパクトを、一つの数値で表現しようとすることです。NBA界隈では、それぞれのウェブサイトやアナリストたちがより良いものを目指して、毎年のように新しいものが生まれています。

まずは、PIPMを簡単に説明したいと思います。簡単な説明をしたあと、もっと具体的な計算や調整方法を、さらに興味のある方向けに書きます。興味がある方は、最後まで読むとさらに理解が深まるかと思います。

PIPMは1選手につき1つ、総合的なインパクトとして値があります。ですが、オフェンスの値とディフェンスの値を単純に足す形でその総合的な値が求まるので、オフェンスの値(O-PIPM)とディフェンスの値(D-PIPM)の2つに分けることができます。これらの値は、選手がチームの得失点に与えるインパクトを表すもので、単位は100ポゼッション毎の得点です。

PIPMの計算を行う際に、必要なデータは主に以下の3つになります。

  1. 選手のボックススコアでの貢献度

  2. 選手のOn/Offデータでの貢献度

  3. 選手オンコート時のORTG/DRTG(リーグ平均との比較)

ボックススコアの数値が良ければ良い程PIPMの数値は高く、On/Offデータ(その選手がコート上にいる時間帯と、いない時間帯のORTGとDRTGの差)が良ければ良い程PIPMが高く、また、チームのORTG・DRTGがリーグ平均と比べて高ければ高い程PIPMは高くなります。それぞれ逆も然りです。

これら3つのデータを見て、足し合わせる事によってPIPMは選手個人の総合的なインパクトを数値化しようと試みています。ボックススコアとOn/Offデータの両方を見る事によって、いわゆる「数字に残る活躍」に加え、「数字に残らない活躍」もキャッチしようとしているのがPIPMの最大の特徴です。

On/Offデータを見る事によって、ボックススコアのみしか見ない指標よりもディフェンス面の評価が格段に改善されます。理由は、ボックススコアには、ディフェンスでの貢献がスティールとブロックしかなく、その2つも必ずしもディフェンスが上手かを見るのに有用なスタッツとは言えないからです。

PIPMは選手の才能・能力を表すものではなく、「ある起用法をした時、試合に与えるインパクト」を表すものですので、値を見ていく際には注意が必要です。選手自身の移籍による役割の変更、またチームメイトの入れ替わりによるチーム内での役割の変更といった、起用法や役割が変わるとインパクトの値は大きく変わります。

計算方法

ここからはもっと深く計算のプロセスに入っていくので、興味のある方だけ読んでください。

1 選手のボックススコアでの貢献度

まず、ボックススコアの部分の説明から始めます。ボックススコアスタッツでも、使うのはペースアジャストされた36分換算のボックススコアスタッツです。ペースアジャストは至って単純で、(チームのペース)/(リーグ平均のペース)を各項目に掛けるだけです。これは36分換算のスタッツで、ペースが遅いチームの選手の数値を少しだけ上げ、速いチームの選手の数値を少しだけ下げるために行います。

Box-PIPMの係数については、Jacob GoldsteinがNBAの15年サンプルのRAPM(Regularized Adjusted Plus-Minus)と各種ボックススコアスタッツを使い、重回帰分析を行い、計算したものを使います。具体的な係数は、こちらにあります。

対象シーズンの各種スタッツと係数を掛け合わせ足し合わせたら選手一人につき、オフェンスの値が一つ・ディフェンスの値が一つ出てきます。この後、チームアジャストメントというものを行います。チームアジャストメントは、BPM(Box Plus-Minus)という別のインパクトメトリクスで行われる処理と同じもので、ORTGがリーグ平均のチームでは、Box-PIPM× 出場した分数の%(分母は、チームの試合数×40分)の合計がゼロになるように、定数項を与えることです。これをオフェンスとディフェンスの両方で行います。

2 選手のOn/Offデータでの貢献度

次に、On/Offデータの部分を計算します。ここで使うのは、ラックアジャストされたOn/Offのレーティングです。ラックアジャストメントというのは、選手一人が影響を及ぼしにくいとされている、相手のスリーポイントの確率と相手のフリースローの確率の2つを、リーグ平均の確率で置き換えること(正確に言うとスリーポイントはリーグ平均に近づけるような処理)により運要素を取り除こうとする処理です。この処理をしたうえで、選手のオンコート時のチームのORTGからオフコート時のチームのORTGを引くとOn/OffのORTGが計算できます。DRTGも同じです。ここでは、選手が出場している時間帯のチームのパフォーマンスと、ベンチにいるときのチームのパフォーマンスの差を調べることで、チームのオフェンス・ディフェンスにどれだけ貢献しているかを、結果ベースでみている項目です。

3 選手オンコート時のORTG/DRTG(リーグ平均との比較)

最後に、3つ目のオンコート時のORTG/DRTGを計算します (原文ではAVGと記載あるものです) 。オンコート時のレーティングを見ることにより、選手が所属しているチームが、選手オンコート時にリーグ平均と比較してどれだけオフェンス・ディフェンスの効率が良いかを見ます。平均的な(例えばORTGが110)チームでOn/Offが+5の選手より、強い(例えばORTGが120)チームでOn/Offが+5の選手の方がいい選手である可能性が高いため、このオンコート時のレーティングの情報も参照します。

3つのデータの合成

この3つの数値を使って計算する前に、小さなサンプルに対応するための調整が一つあります。プラスマイナスの部分(On/OffとAVGの部分だと私は解釈しています)に関して、選手の出場時間(分)を、全試合フル出場した場合の分数で割り、その平方根をとったものを掛けるという調整です。サンプルが小さければ小さい程この調整でゼロに近づきます。

この調整をした後に、3つのデータを混ぜて一つの数値にします。3つそれぞれに係数を掛け合わせ(この係数も15年サンプルのRAPMから回帰分析をしたものです)、足してオフェンス・ディフェンスそれぞれ一つの値を計算します。この(一旦の)PIPMを計算した後、次はReplacement levelに近づける調整を行います。これも先程と同じく、小さなサンプルに対応するための調整です。オフェンスには-1.7のレベルで350分、ディフェンスには-0.3のレベルで450分のプレーを全員にインプットします。

また、最後にもう一度チームアジャストメントを行います。先程Box-PIPMのところで一度行っていますが、ここで同じことをオフェンス・ディフェンスそれぞれもう一度行います。ここでの調整は、先程より数値は小さくなるはずです。

これで、PIPMは完成です。Jacob Goldsteinによると、PIPMは15年サンプルのRAPMとの間に0.875という相関係数が計測されているそうです。また、PIPMとRAPMのディフェンスの部分だけを見ても、0.843と、高い数値です。これは、ボックススコアだけを見ている指標の場合には成しえない数値であり、On/Offのデータを入れることによって評価の精度が各段に上昇したと言えるでしょう。

ただ、PIPMも弱点は存在します。計算の過程で3つ目の要素であったチームのORTG/DRTGを使用していることにより、強いチームでプレーした平均的な選手を過大評価してしまったり、弱いチームでプレーした良い選手を過少評価してしまったりと、この3つ目の要素に引っ張られすぎる印象が多くあります。また、単純なOn/Offデータを見ていることから、一緒に出ているチームメイトの影響にも引っ張られることがあります。完璧なオールインワンメトリクスは存在しないので、PIPMにはこのような特徴があるということを頭に入れておきながら値を見ていくと、良い使い方ができると思います。

以上、長文となりましたが、読んでくださった方、ありがとうございました!BリーグのPIPMのデータは、2017-18シーズンまで遡ったデータをこちらで公開しています。興味のある方は是非!Xでのご感想やご質問などもお待ちしております!

この記事が気に入ったらサポートをしてみませんか?