見出し画像

バスケのディフェンス指標の現状と今後 ~If You Thought Playing NBA Defense Was Hard, Try Quantifying Itを元に~

こんにちは
以前、NBAでのディフェンス指標についてまとめられた記事を紹介しました。

そして少し時間が空き、この記事を再読してみたのですが、やはり面白い内容だったので、内容をまとめてみようかと思います。
(記事の内容の再構成や補足の情報追加などをしています)

ディフェンス指標(defensive metric)って何?

自分なりにまとめると、選手ごとのディフェンスの良し悪しを数字化して、比較できるようにしたものです。
実際に見たほうが分かりやすいので、下記に掲載します(例:real plus-minus)

画像1

ここではDRPMがディフェンス指標となっており、選手ごとに数字が割り振られていることが分かると思います。
この数字の大小を比較して選手のディフェンスの良し悪しを判断するといったものになります。

NBAでは色々なディフェンス指標があり、本文で紹介されているディフェンス指標は下記の5つです(カッコ内は掲載しているサイト)
real plus-minus (ESPN)
estimated plus-minus (Dunks & Threes)
regularized adjusted plus-minus (NBA Shot Charts)
RAPTOR (FiveThirtyEight)
LEBRON (BBall Index)

regularized adjusted plus-minusのみ、実際のスタッツページが見つからなかったので、定義などについて言及されている記事を紹介します
https://squared2020.com/2017/09/18/deep-dive-on-regularized-adjusted-plus-minus-i-introductory-example/

ディフェンス指標の目的と現状の評価

上述したディフェンス指標ですが、わざわざこのような指標を作るからには目的があるはずです。

ファンが眺めてバスケ談義が盛り上がるなどもありそうですが、それは置いといて、記事内ではメリットについて下記のように述べられています

・フロントオフィス
→選手の評価を適切に行えることで、他のチームに比べて有利になること
・選手
より正確な値が得られればトップディフェンダーへの報酬も向上するため
※値に信頼性がないと、高い数値を出していてもチーム側がお金を出しづらい(本当にDFに優れてるのかが怪しいので)。

ただ、一方でダリル・モーリーが「ディフェンスの分析方法は複雑で誰もマスターしていない」と述べたり、10数人のNBAアナリストのアンケートでオフェンスとディフェンスのスタッツの質を10段階で評価してもらったらオフェンスが7.6という数値に対してディフェンスは3.6や5.6という数値になっていたりなど、現時点ではディフェンス指標は不完全との認識がされています。

ディフェンス指標の問題点

ではなぜディフェンス指標は不完全と思われているのでしょうか?
不完全ということは何かしらの懸念点があることになりますが、記事内ではその懸念点について様々な指摘がされています。そこで、この節ではその内容をまとめていきます。

まず、ディフェンス指標の算出に用いるデータの観点からです。
本文中で言及されているデータの種類は
・ボックススコア
・on/off データ
・トラッキングデータ
の3つがあり、それぞれに課題が指摘されています。

ボックススコアの課題
ボックススコアに採用されているディフェンススタッツはリバウンド、ファール、ブロック、スティールの4つですが、この内ブロックとスティールは発生回数の少なさや、ブロックやスティールをあまりしないDFスペシャリストを評価できない形になります。
また、リバウンドに関しては、ディフェンスリバウンドで争奪戦になるのがリーグ全体で24%ほどでノイズが多かったり、選手個人のリバウンドの数値とチーム全体のリバウンドの数値に大きな関係がなかったりなどが指摘されています。
ファールに関しても、この数値の上昇はDFが活発になったことを示すシグナルにすぎないとのコメントがあります。
このように、ボックススコアに採用されているディフェンススタッツはそれぞれに課題があり、この数値で選手のDFを判断することは「ぼやけた写真に目を細めて、そこから何かを見つけようとするようなものだ」とBen Falk(PHIとPORで分析や戦略策定を行っていた方)が述べています。

on/offデータの課題
on/offデータはある選手が出場中とベンチに居るときのチームの得点の大小を、十分な数のサンプルがあればチームメイトや対戦相手の違いを調整して分析することで、一人の選手が対戦相手の得点に与える影響を明らかにすることができます。
これを使うと、スタッツには表れないけどよい働きをしている選手を評価することができます(コビントンなど)。
ただ、これにも課題が2つあります。
1つが、なぜその数値が高いのかが分からないという点です。
例えば、コビントンはon/offデータで良い評価を得ていますが、これはプレーを見ると対人DFが優れていると言うより、ヘルプの上手さが影響していることが読み取れます。
しかし、これはon/offデータでは見抜けない観点となります。
もう一つは、他の影響を除外するために非常に大きなサンプルが必要ということです。
例えば、特定の選手と一緒にプレイする時間が長いので個々の貢献度を分けられなかったり、セカンドユニットが悪くて相対的にスターターのデータが良く見えてしまうなどです。
Box plus minusを開発したMyersは「1シーズンのRAPMは基本的に役に立ちません」とのコメントを残しています。

on/offデータの問題はオフェンス側でも同じですね(なんでその選手のオフェンスの数値がよいのか分からないなど)。
オフェンスの場合はbox scoreの情報もまだ豊富なのでデータで判断できる要素は大きいですが。

トラッキングデータの課題
NBAではすべての選手とボールの位置を追跡するシステムがあり、そこから膨大な位置情報を作成しています。このデータはビッグマンのリムプロテクションの数値化などDFの計測に進歩を生み出しています。
ただこれにも2つの課題が指摘されています。
一つは、単純にデータの量が多すぎることです。すべての選手とボールの位置を毎秒25回計測することを試合ごとに行っているため、その数は膨大なものになり、そのデータを駆使して意味のある指標を出すことは相当な難易度になっています。どのデータを使えば良い指標になるかを見つけるのに苦労するということですね。
もう一つは、DFの重要なニュアンスを測定する方法が確立されていないことです。
ニュアンスという言葉が分かりづらいですが、具体例を見るとイメージ付きやすいかなと。
「センターが効果的な動きを見せて回復したことで、ウィークサイドコーナーの選手がシューターのところまで戻るのに0.5秒の時間を稼ぎ、それが良いディフェンスのポゼッションにつながった」
また、コート上でのコミュニケーション(マルク・ガソルがDFの指示をチームメイトに飛ばしているなど)や、コーチ・チームメイト・ディフェンスシステムと選手の相性なども捉えきれません

ここでのニュアンスについて、自分は文脈だったり、個々のプレーや選手同士のつながり・関係性という意味合いと捉えています

例えば、ESPNのRPMによると、ブルックロペスは2017-18のレイカーズ時代はセンターでリーグ最悪のディフェンスでしたが、翌シーズンのバックスでは3位にランクインしており、相性の要素が顕著に出た例です。
選手全体で見ても、あるシーズンから次のシーズンにかけてのDRPMはORPMと比べて相関関係が弱く、特にチームを変えた選手の相関関係はとても弱いものになっています(下の図。値は0~1に収まり、1に近いほうが相関関係が強い)。つまり、他チームの選手のある年のディフェンス指標が自分のチームに来た場合にも当てはまるかと言われると怪しいことになります(少なくともオフェンス指標と比べると)

画像2

また、指標の算出ロジックにまつわる課題も2点指摘されています
・同じ選手に異なる指標を用いる際の評価のバラツキ
・安定した結果を得るまでにかかる時間

同じ選手に異なる指標を用いる際の評価のバラツキ
指標によって算出に用いるデータやそれの計算方法は異なっており、その結果、ディフェンス指標間での評価のずれが起きてきます。
こうなると、実際はどの程度の評価になるのか判断をつけづらいことになり、フロントオフィスや選手にとっては悩ましい課題になります。
(下記の図は評価指標間で最もばらつきの大きかった選手)

画像3

安定した結果を得るまでにかかる時間
指標の中には結果が安定して見えるようになるまで時間がかかるため、フロントオフィスが選手の評価をする際に、指標の数値が良かったとしても選手の実力が向上したからなのか、ただのノイズなのかがすぐには分からない状態になります。
特に、若い選手がNBAに慣れている際にこの傾向は顕著に表れます。次の契約を結ぶために早めに安定した結果がほしいのに数年分のデータがないと分からないでは困ってしまいます。

問題点を踏まえた活用方法やまとめ

前節でディフェンス指標が抱える課題をまとめましたが、だからまったく使わないというのも極端な考えです。
スカウティングやフィルムスタディも同じく不正確な面があるため、ディフェンス指標にも価値はあります。
記事内ではそういった価値を適切に発揮するためにいくつかの方法を記載しています。
・複数の指標をミックスする
・シチュエーションやスキルを限定して、そこでのパフォーマンスを分析する
・(大学バスケと比較してNBAのアナリティクスが進んでいることに感謝する)

複数の指標をミックスする
これは、それぞれの指標で過大評価と過小評価している選手がいるから、それを平均してみれば、うまく行けばお互いが相殺されて妥当に選手を評価できるという発想です。
そうすると、すべての指標で上位にきている選手はやはりDFがいい選手で、ある指標では悪い評価で別の指標では良い評価の場合は平均的な選手となります。

この考え方はAIや機械学習のアンサンブル学習と同じような発想かなと思います。
ここで大事なのはそれぞれの指標を生み出すロジックが独立している(≒似通っていない)ことです。
例えばon/offデータをメインに活用している指標同士をミックスすると、on/offデータ特有の過大/過小がそのまま残ることになってしまうので、on/offデータとは異なる考え方やロジックを用いた指標を比べる必要があります。

シチュエーションやスキルを限定して、そこでのパフォーマンスを分析する
ここまでのディフェンス指標は、ある選手が全体的にDFがよいのか悪いのかを判断する用途で使われていますが、それよりも特定の役割にフィットするかを見極めたほうがよいという話です。
例えば、ビッグマンに注目しているチームはリムでのパフォーマンスやピック時のパフォーマンスに注目するなどです。

似たようなことを自分も考えたことがあり、その点に関して千葉ジェッツのビデオアナリストの木村 和希さんにコメントをいただいたのでここでも紹介します。
要は、似たような選手を何かしらの方法で集め、その中で指標を元にどの選手を選ぶべきか考えるという流れです。
自分の解釈では、似たような選手が集まるなら過大/過小評価の傾向も似通るので順番がそのままDF評価につながるという捉え方です。

最後の大学バスケ云々は記事の著者の軽いジョークみたいなもので、具体的な提案ではないです(一応掲載しましたが)。

読んだ感想

NBAで算出されているDF指標の現状だったり、チームとしてどう活用したいのか等が様々な例や関係者のコメントで具体的に書かれていてとても学びになりました。
やはり、実際に算出して活用しようとしている人の現場ならではの知見は中々面白いですし、自分もこの世界を開拓したい気持ちがさらに強くなってきました。
ここでまとめていない内容もあるので、興味のある方は原文も読んでみることをおすすめします(DeepLなどの翻訳サイトなどで訳せば読み進められると思います)

ということで今回は以上です。
ご質問・ご指摘などありましたらコメントいただければと思います。
(敬称略)


投稿主のTwitterアカウント



サポートしていただけるとありがたいですが、 SNS等で広めていただけるともっとありがたいです。 一緒にバスケを盛り上げていきましょう!