見出し画像

【バスケのデータ分析論文紹介】NBA Lineup Analysis on Clustered Player Tendencies: A new approach to the positions of basketball & modeling lineup efficiency

こんにちは

本記事ではMIT Sloan Sports analytics conferenceで発表された、NBAのポジション定義と効率的なラインアップに関する論文の紹介をします。

ランダムフォレストやGaussian finite mixture modelsといった高度な分析手法を使っていたり、新たなポジション定義の話が出ていたりするので、スポーツでの分析手法の当てはめ方に興味のある方やバスケのプレイに関するトレンドなどに興味のある方におすすめです。

他にもスポーツの分析に関する様々な論文が発表されているので、興味のある方は見てみると良いかもしれません。


概要

この論文ではNBAでの新しいポジションの分け方の検討と、効率的なラインナップにするためのポジションの組み合わせの分析を行っています。

近年のNBAでは従来のポジションの枠組みで説明できないスキルやスタイル*1が出てきているため、新しい枠組みを検討することで選手の役割などに関する洞察を得られるとしています。

また、効率的なポジションの組み合わせを分析することで、フロントオフィスが選手の獲得や育成を行う際に有益な情報を与えられるだろうとしています。

*1
例えばデリック・ローズとクリス・ポールは、従来のポジションではどちらもPGとなりますが、役割やプレイスタイルはぜんぜん違うよね、といった例が出ています。ごもっともですね。
他にも、Usageやスペースを広げるスキルなどが、従来の分け方では考慮しきれていないとも述べています。これもごもっともですね

分析内容

新しいポジションの分け方

最初はk-meansを利用していたが、満足できなかったため、model-based clusteringを行いました。
具体的には23種類の変数を用意し、Gaussian finite mixture modelsにフィットするようにEMアルゴリズムを利用しています*2。
この手法のメリットとして、生成された各クラスタに割り振られる確率が出力されるので、複数のポジションにまたがる選手の存在も確認できます(後述)。

*2
この辺の諸々の手法の内容に関しては自分自身理解が及んでいません。。。


効率的なラインナップの組み合わせ

上記で抽出されたポジションの分け方を元に、どのように組み合わせればNet Ratingが最も高くなるかを、ランダムフォレストを利用して予測しています。


結果

新しいポジションの分け方

下記9つのクラスタが作成された。

High Usage Guard
- ボールを保持しながら各選手への配球も行うガード。Ball Dominant Scorerよりは効率が悪く、Floor Generalよりパスファーストでもない
- 平均より高い数値のスタッツはAST rateとUsage Rate
- 平均より低い数値のスタッツは2FG AST RateとHeight
- 具体例は'14のルーウィリアムズとブランドン・ジェニングス
Strerch Forward
- フロアを広げて3Pを決める役割を担う選手。Three Point Shooting Guardより身長が高くてリバウンドを取り、Skilled Forward よりドリブルをつかない
- 平均より高い数値のスタッツは3FGA%とHeight
- 平均より低い数値のスタッツはUsage RateとFTr
- 具体例は'12のシェーン・バティエと'13のスティーブノヴァク

Three Point Shooting Guard
- C&Sの選手。Stretch Forwardより身長が低く、High Usage Guardよりボールを保持しない
- 平均より高い数値のスタッツは3FG%と3FG AST Rate
- 平均より低い数値のスタッツはOReb rateとTurnover Rate
- 具体例は'17のクレイ・トンプソンと'18のJJレディック

Traditional Center
- リム周りでプレイし、ミッドレンジ以上の距離からシュートをあまり打たない。効果的なリバウンダーであり、リムプロテクターである
- 平均より高い数値のスタッツはDunk att. rateとOReb rate
- 平均より低い数値のスタッツは3FGA%と3FG%
- 具体例は'15のデアンドレ・ジョーダンと'18のタイソンチャンドラー

Versatile Role Player
- ほとんどのスタッツで平均的。突出したスタッツもないが大きく平均を下回るスタッツもない。ガードとフォワードの混合型。
- 平均より高い数値のスタッツは2FG AST rateとOReb rate
- 平均より低い数値のスタッツはPointsとFGA
- 具体例は'14のショーン・リビングストンと'18のバムアデバヨ

Floor General
- パスファーストのガードで身長が低く、High Usage GuardやBall Dominant Scorerよりシュートを打たない傾向。
- 平均より高い数値のスタッツはAST rateとTurnover Rate
- 平均より低い数値のスタッツはHeightと2FG AST rate
- 具体例は'11のジェイソン・キッドと'12のラジョン・ロンド

Mid-Range Big
- リムでプレイするが、外に出て10~16ftでのジャンプシュートも打つ。オフェンスリバウンダーというよりディフェンスリバウンダー
- 平均より高い数値のスタッツは10ft- 3P FGA%とDReb rate
- 平均より低い数値のスタッツは3FGA%と3FG%
- 具体例は'09のパウ・ガソルと'15のティアゴ・スプリッター

Skilled Forward
- 身長が高くスキルを持った選手。ドライブもできるが、ほとんどの3Pシュートはアシストを受けてのシュート。Stretch Forwardよりリバウンドが取れるが、3Pシュートの数は少ない
- 平均より高い数値のスタッツはDReb rateと3FG AST rate
- 平均より低い数値のスタッツはAST RateとSteal rate
- 具体例は'14のアンソニー・デイビスと'11のサージ・イバカ

Ball Dominant Scorer
- High Usage Guardより効率的。得点を取ることが第一のように見えるが、パススキルも持っており、必要に応じて配球も行う。ほとんどの2Pシュートはリングへのドライブから生まれている。ほとんどのケースでチームのgo-to scorer
- 平均より高い数値のスタッツはPointsとUsage rate
- 平均より低い数値のスタッツはCorner 3FGA%と2FG AST rate
- 具体例は'18のジェームズ・ハーデンとレブロンジェームズ

上述の通り、このモデルのメリットとして、一つのクラスタに強く当てはまる選手もいれば、複数のクラスタに中程度ずつ当てはまるプレイヤーもいるということを考慮できます。
例えば'17のダーク・ノビツキーは50%のskilled Forwardと50%のStretch Forwardとして分類されます。

通常のクラスタリングでは、必ずどこかのクラスタに属することになるので、こういった形で跨りを考慮できるのは新規性ありますね。

効率的なラインナップの組み合わせ

上述のポジションの考え方を元に、ラインナップごとのポジションの割り振られ方と実際のNet Ratingデータを利用し、ランダムフォレストで割り振られ方のパターンごとのNet Ratingの予測値を算出しています。

ポジションの割り振られ方について、複数のポジションにまたがる選手がいるので、下記画像のように出場する5人の選手の確率の合算を"Soft Lineups"としてパターン化しています。

画像1

Net Ratingの予測値が一番高かった組み合わせは、Ball Dominant Playerが1.25人、Versatile Role Playerが2.25人、Traditional Centerが1人、Stretch Forwardが0.5人となっていました。
また、最も予測値が低かった組み合わせは High Usage Guardが2人、Versatile Role Playersが2.25人、Floor Generalが0.25人、Skilled Forwardsが0.5人でした。

その他、細かいデータなどがありますが、ここでは触れませんので興味のある方は論文をお読みください。

感想

これまで自分の中で考えていなかった取り組みがあってとても新鮮でした。
例えばクラスタリングに関して、各選手は必ずどこかのポジションに属することを暗黙の前提としていましたが、そこには複数のポジションをこなすorこなせるという観点が抜けており、そこに光を当てていたこの論文はとても興味深かったです。
しかも、ポジションの定義にとどまらず効率的なラインナップの検討もしており、チーム編成にも統計的なアプローチの可能性を見出しているところも面白い観点でした。

ただ、気になる点もいくつかありました。
例えば、選手ごとのポジションの確率が出ていますが、ポジション内でのスキルの上下という観点はありませんでした。
同一のポジション構成のラインナップだったとしても、選手自身のスキルの上下でNet Ratingが変わることはありえそうです。
他にも、DF系のスタッツの不足などがあり、そういった点でブラッシュアップの余地がありそうです(データの取得が難しいなどはありそうですが)

総じて、アプローチが面白く発展性もありそうな論文だったと思っています。面白かった。


蛇足コメント1
解析にRを利用しているので、なんとなく親近感を覚えています笑

蛇足コメント2
著者は大学生らしく、アメリカは進んでいるなという印象を改めて受けました。すげえな。

サポートしていただけるとありがたいですが、 SNS等で広めていただけるともっとありがたいです。 一緒にバスケを盛り上げていきましょう!