【データ分析】アクションの価値から選手を評価する【statsbomb ロシアW杯】
宣言したので、まとめます。VAEP(Valuing Actions by Estimating Probabilities)という指標によって、ロシアW杯出場選手をポジションごとに評価・ランキングしていきたいと思います。
VAEPとは、各アクション(パスやドリブルなど)の得点(+失点)への寄与度のこと。イベントデータをもとに得点/失点を予測するモデルを学習することにより、各アクションによる得点/失点の期待値の変化を推定可能。この期待値の変化をアクションの価値(=VAEP)として定義することで、各アクション/選手を評価。(論文の解説記事はこちらから)
このモデルでは各アクションに対してVAEPが算出されます。今回のnoteでは選手を評価するために、以下の3つの処理を施して分析を行っていきます。
1. 90分あたりの各アクションのVAEPの総和を選手の評価値とする
→ 選手間で出場時間が異なるため、正規化
2. 出場時間が150分以上の選手を解析対象とする
→ 出場時間が短い選手はサンプルから外す
3. 複数ポジションをこなした選手に関しては、最も出場時間の長いポジションで集計を行う
→ 複数ポジションに同選手がランキングされない
縦軸=90分あたりのアクション数、横軸=90分あたりのVAEPの総和として、各ポジションごとにトップ20選手の国旗と選手名の散布図により可視化を行なっていきます。各図の右上にいる選手はボールに多く関わりながら、得点/失点への寄与率が高い選手ということができます。反対に右下にいる選手はボールへ関わる回数が少ないながらも価値の高いアクションを行えた、いわばワンチャンをモノにできる選手といえます。
(シンプルに見るならば、右側にいる選手が価値の高いアクションをする選手です)
1. Goalkeeper
ナバス、シュマイケル、ロリスとゴールライン際に強いGKが上位に来ています。この手法では失点予測モデルも学習しているので、失点する確率を大きく減らすアクション=ビッグセーブを多く行なった選手が評価されます。しかしながら、止める前に仕事をしているGK(コーチング等で)がいいGK!とも言えなくもありません。また、攻守両方のアクションに対しての評価をまとめているので、これらを分けて集計しても面白いかもしれません。(ビルドアップでは価値を発揮していたけれど、全然シュートストップできないGKとか見えてくるかも)
2. Center Back
2ゴールを決めたコロンビア代表のミナがトップに。ドイツ戦で値千金のゴールを獲ったガンバのキム・ヨングォン等、CBのGK同様、攻守のアクションで分けた方が良さげです。
3. Side, Wing Back
次はサイドバック。日本戦でゴールを決めたセネガルのムサ(オイペン時代は豊川雄太の上に住んでいたらしい)がトップに。2位は日本戦の決勝ゴールをアシストしたムニエ。今大会はグループリーグ敗退に終わったドイツ代表のキミッヒが地味に評価されているのが面白い。結果として得点にはならなかったものの、その期待値を高めるアクションが多かった選手を発見できるのは有益。アシスト未遂も含めることができるってこと。
4. Defensive Midfield
ここで初の日本人選手がランクイン。0.225を境にグループができているのは、攻撃型なDHと守備型DHの溝だろうか。同じポジションでも与えられる役割が大きく異なるこのポジション。もう少し深掘りする価値あり
5. Center Midfield
圧倒的なトニ・クロース。次にコウチーニョ、デブルイネ、ポグバ。名手たちがちゃんと上位に来ていて安心。(意外な結果が欲しいのか、それとも妥当性のある結果が欲しいのか。。。難しい)
6. Attacking Midfield
やっぱりメッシ。アクション数は多くないけれど価値のあるアクションを実行できるサラー。強烈なインパクトを残したロシア代表のゴロビン。(エジルってロシアW杯で冴えてなかった印象だけれど)
7. Side Half, Wing
4ゴールでドーピング疑惑までかかったロシア代表のチェリシェフがトップに。次にPSGのネイマールとムバッペがランクイン。ムバッペはネイマールに憧れないでもらいところ。(W杯中もシミュレーションっぽいのや非紳士的な行動が目立った)
8. Forward
最後はFW。ここばかりは得点数との相関がかなり強い印象。シュート以外で集計したら面白い評価軸になりそうです。(柳沢みたいな選手が上位にくる可能性)逆にシュートのみにアクションを絞って下位からみたら、ビッグチャンス逸脱ランキングが出来上がり。自分が選手だったら、作成して欲しくないのでやりません。
まとめ
今回はKDDに投稿された論文の手法を使って、選手×ポジションという軸でランキングを作成して、考察しました。ラバーダッグデバッグのように、noteにまとめている最中、いろいろアイデアが出てきたので、やっぱりアウトプットis大事ですね。引用RTにてプラスアルファな考察を待っています。