見出し画像

#66 個人スタッツからチームの勝利貢献度を計るには?

遠藤保仁がいればチームの勝ち点は117%になる
データが見せるサッカーの新しい魅力

今日はこちらの本についてアウトプットしていきます。

以下目次になります。

〜目次〜
この本を読んだ背景
本の概要
気になったポイント
仕事への応用

この本を読んだ背景

「統計学が最強の学問である」を読み、統計学の万能さを理解しました。

「統計学が最強の学問である」についてのアウトプット記事はこちらから⬇
https://note.com/sezakinoutput/n/ncd10db47447d

具体的にどのような分野に統計学が応用されているのか、細かく知りたくなりました。
そこでこの本の中の参考文献のひとつであるこの本を読んでみることにしました。
自分がしていたサッカーへ統計学を応用した話は面白そうだと思いました。


本の概要

「データからサッカーを読み解く」

日本国内のサッカーに関するデータを収集する「データスタジアム」のデータから、各選手の特徴を読み取り、どのように得点や失点、そして勝利へ貢献しているのか読み取る。

データを見れば、うまいプレーヤーがなぜ上手いのか明確になる。
パスなのか、シュートなのか、ドリブルなのか?
それともタックルなのか、空中戦の強さなのか?

「あの選手はこのプレー得意そう」という仮説から、データに基づいた判断を行うことで、特徴や貢献度を明らかにすることができる。



気になったポイント

◎データを使うことで今後の活躍が期待できる選手を探す

試合出場時間は少ないものの成果を出しているプレーヤーがいる。
すなわち、90分換算のスタッツを調べ、リーグ戦トップレベルの選手と比べることで、潜在能力をはかることができる。

◎個人スタッツだけで選手の優劣をつけるな

スタッツの値だけでは選手の優劣を決めるのは難しい。
というのも、それぞれのスタッツが勝敗にどう寄与するのか全く検討していないからである。
→失点や得点、勝ち点とそれぞれのスタッツとの関連性を分析し、各選手の勝利への寄与率を考慮するべき。

◎どのように選手の特徴を把握するのか?

・データを扱いやすいものにする

「データの縮約」
複数項目の変数の持つ情報量を可能な限り保ったまま、より少ない項目で表せるようにすること。
これにより膨大なデータを扱いやすくなり、相関を確かめることができる。
(今回の例では200あまりのデータを10個の主成分に縮約した)

主成分とは・・・
何らかの縮約で抽出された「新しい軸」のこと

「説明率」
全体における主成分によってよく説明できたデータの値の割合(若干のズレは起こる)のこと。
説明率と主成分の折れ線グラフを作り、傾斜が緩やかになる直前までを採用することで、関係性の高そうなもののみを調べることができる。

今回は10個の中から5個を選んだ。
①パス数を中心として総プレー数が多いか(例:総プレー数、総パス数など)
②シュート数やアタッキングサードでのパスなど前線で攻撃参加しているか(例:枠内シュート数、ATからのパス割合など)
③空中戦で攻撃参加しているか(例:敵陣PAでの空中戦回数、ヘディングシュート数など)
④パスの成功率は高いか(例:パス成功率、敵陣でのパス成功率など)
⑤プレースキックを任されているか(例:CK数、FK失敗数など)

ここからそれぞれの主成分上位20名の選手を挙げる。
これらの主成分の組み合わせからクラスターを8つに分類した。

8つのクラスター
①CF(攻撃参加と空中戦回数最大)
②司令塔(プレー関与、プレースキック最大)
③OH/ST(大型センターフォワードに次いで攻撃参加の度合いが高い)
④DH(プレー関与、パス精度高い)
⑤CB(攻撃参加は少ないかがらも空中戦についてのみ積極的)
⑥サイド(プレーへの関与としては少なくないものの、シュートや空中戦には参加せずパス精度低い)
⑦控え(プレーへの関与が著しく低い)
⑧なし(⑦以上にプレー関与の低い、ほぼ出場機会なし)

・これらのデータ縮約、クラスタリングをどう使うか?

→必要選手の代役を探す。
同一クラスター内の選手、関心の高い主成分から必要な能力を持つ選手を探すこともできる。

→チームにおけるポジションの過不足を検証する。
チームことのクラスターを集計して戦力バランスを読み解く。
トレードを含む補強を考えるうえで重要。
例:④DHが0のチームはDHタイプの選手を補強する、類似する他のクラスターの選手に役割をもたせる必要がある。

◎「得点や失点に対する貢献度」について調べる

シュートについて、アシスト(パス)について、守備について、セーブについての貢献度をロジスティック回帰モデルを用いて計る。

シュートの場合、シュートが1本増えるごとに平均的に何倍勝利しやすいか、勝利しない場合の中で何倍ドローになりやすいか、という値を推定した。

この倍率のことをオッズと呼ぶ。

4つの指標(シュート、アシスト、守備、セーブ)と勝利オッズ、ドローオッズの組み合わせとリーグ戦における勝ち点(勝利3点、引き分け1点、負け0点)を掛け合わせ、チームの勝ち点への貢献度合いを算出した。

この4つの中でも「アシスト」が勝点を上げることに最も貢献する項目であった。

そして最も勝ち点の獲得に貢献したプレーヤーこそ遠藤保仁であり、算出された貢献度と2011シーズンのチーム(ガンバ大阪)の勝ち点から計算すると「遠藤保仁がいればチームの勝ち点は117%になる」と言えた。
(これは遠藤保仁がチームにいない場合と比較している。)


仕事への応用

この本で述べられていたのは具体的な個人の選手情報から勝利への貢献度を計るという手法でしたので、世間一般の多くのユーザーに当てはめるのは難しいです。

サッカー以外のスポーツには当てはめやすく、すでに多くのチームで応用されています。
それこそ、自分が好きなe-sportsではすでにさかんに行われており、メンバーや役割、戦略を決定するのに役立っているそうです。
(いつもそういった戦略を参考にしています。)

ビジネスの視点で考えると、あるプロジェクトのメンバー決定、役割決定の際にこうしたデータが使われる日が来るかもしれませんね。

その際には社内のメンバーひとりひとりのプロジェクトに関するデータが必要になります。

どの指標を計り、どう整理するのか難しそうですが、とても面白い試みになりそうだなと感じました。


SezakiN