見出し画像

【論文紹介】選手間の"ケミストリー"を科学する【欧州サッカー】

MIT Sloan Sports Conference2020で発表された論文を紹介するシリーズ第1弾 !『Player Chemistry: Striving for a Perfectly Balanced Soccer Team』というタイトルの論文を紹介したいと思います。タイトル通り、選手間の相互作用である"ケミストリー"をデータ分析の観点から検証した内容になっています。「ケミストリーという言葉が聞きなれない!」という方は、是非サッカーゲームのFIFAでも採用されているので、イメージを以下のページから掴んでいただければと思います。

著者はKU Leuven×SciSportsというチームのメンバーで、データマイニングのトップカンファレンスであるKDD19で、Best Paperになった論文も通しています。(当該論文の実験結果は以下のnoteで紹介しています。今回の論文も"アクションの価値"であるVAEPを活用したものになりますので、目を通していただけると理解が早いかと。)

本noteは以下の構成で進めていきます。

1. ケミストリーの算出方法

step1. イベントデータから抽出した特徴から、得点 / 失点を予測するモデルを構築する
step2. step1で構築したモデルより推論される"得点期待値"の増分を、各アクションの価値(VAEP)とする

(ここまでがKDD19 ADS Best Paperの内容。ここからが本論文)

step3. 次のアクションのVAEPを足し合わせ、各アクションのVAEPを再計算する (組み合わせの要素を考慮する)
step4. チーム内の選手ペアのVAEPの合計を、出場時間で正規化して集計したものを、ケミストリーとする。守備のケミストリーは対面した相手VAEPから計算する。

(ここからは、予測に関する内容。プレーしたことのない選手ペアを考えられる)

step5. 各選手の特徴(年齢、母国、ポジションや能力値等)からstep4で算出したケミストリーを予測するモデルを構築する
step6. チーム全体のケミストリーを最大化するメンバー選出を、数理最適化問題で解く

2. 実験結果①ケミストリーの高いペアのランキング

(表が分割されて論文に記載されていたので再作成しています)

1. サラー×フィルミーノ、リバプール(17/18 UEFA Champions League)、0.7077
2. スアレス×メッシ、バルセロナ(15/16 リーガ)、0.6497
3. 永里、ケール、シカゴ・レッドスターズ(19 NWSL)、0.6096
4. Aterm Milevskiy×Pavel Nekhaychik、ダイナモ・ブレスト(17 ベラルーシ)、0.6050
5. Oleksandr Mishurenko×Oleksandr Akymenko、Inhulets(18/19 ウクライナ2部)、0.6017
6. イブラヒモビッチ×ディ・マリア、PSG(15/16 リーグアン)、0.5972
7. Dario Kovacić×Sirlord Conteh、St. Pauli(18/19 ドイツ4部)、0.5873
8. Gabriel Barbos×Giorgian de Arrascaeta、フラメンゴ(19 ブラジル1部)、0.5763
9. サネ×スターリング、シティ(18/19 プレミア)、0.5701
10. タディッチ×クインシー・プロメス、アヤックス(19/20 オランダ1部)、0.5700

直感通りのサラー×フィルミーノ、スアレス×メッシに加えて、日本代表の永里優季がランクインしているのは素晴らしいですね。知らない選手の名前もあって、ペアで選手獲得!みたいなことも出てくるかもしれませんね。

(このほかにも、実験結果の章には「リバプールのスタメンのケミストリー」と「エジルとアーセナルのケミストリー」の算出と考察がありましたので、興味がある方は是非。)

3. ユースケース①マンチェスター・シティが獲得すべきCBは?

ここからは、一緒にプレイしたことのない選手同士のケミストリーを予測して、考察をしていくユースケースの章の内容になります。最初は「シティが獲得すべきCB」について。(節の冒頭ではコンパニの移籍、ラポルトの怪我、そしてフェルナンジーニョがCBでプレイする現状に触れつつ、この考察の重要性を解いていました)

クリバリ(ナポリ)、シュクリニアル(インテル)、アルデルヴァイデルト(トッテナム)とシティの守備4選手との攻・守それぞれのケミストリーを予測し、棒グラフにて可視化した図が下のものになります。攻守両面のケミストリーを踏まえると、クリバリがベストな選択肢なようです。

スクリーンショット 2020-03-25 15.51.27

続いて、上記候補3選手と、シティの攻撃的な5選手との攻撃のケミストリーを予測したものが以下になります。ロングパスに定評のあるアルデルヴァイデルトと、攻撃的な選手のケミストリーが高いのには納得がいきます。したがって、DFラインの組み合わせでいうとクリバリだけれど、ビルドアップの能力を踏まえるとアルデルヴァイデルト?さぁどっちを選ぶ!みたいな使い方ができそうです。(お金のあるクラブであれば)

スクリーンショット 2020-03-26 14.01.01

4. ユースケース②レアル・マドリードの右WGにベストな選手とは?

次は、マドリーの右WGについてです。シーズン頭に負傷していたルーカス・バスケスの穴を誰が埋めるのか。候補としたのは、ベイル、ロドリゴそしてヴェニシウスの3選手です。この3選手を比較する上で考慮しなければいけないのが、長くマドリーでプレイしているベイルについてです。ともにプレイした経験のあるペアほどケミストリーの値が高くなるのは自明ですから、これからマドリーで出場した試合数が増えたときに、ケミストリーの値がどう変化するのか?ということを予測して可視化したのが以下の図になります。出場試合数を重ねるごとに、ヴェニシウス、ロドリゴのケミストリーが高くなる、=チームにフィットすることが予想されるので、新規加入選手を試合に出す方がマドリーにとって長期的なメリットをもたらしそうです。

スクリーンショット 2020-03-26 14.14.12

加えて、現段階で予測される19/20シーズン頭の攻撃的なケミストリーがこちらです。アザールを除いた3選手とプレイ経験のあるベイルが最も高く予測されています。(というより、誰とでもケミストリーの高いベンゼマがすごいし、納得感あるし、そんな選手に自分もなりたいです)

スクリーンショット 2020-03-25 15.22.54

5. ユースケース③ツィエクが移籍すべきクラブとは?

最後は、先月にチェルシーへの移籍が決まったアヤックスでブレイクしたハキム・ツィエクについてです。まず初めに、SciSportsが持っている機械学習モデル(!!!)から予測された3つの指標(移籍後の出場試合時間、移籍後の能力値の変化、移籍金)から、移籍候補クラブを5つ選出し、それぞれのクラブでの攻撃的なケミストリーを予測したのが以下の図になります。トップはバイエルンとなりましたが、移籍が決まったチェルシーが2位にランクインしているのが興味深いです。予測通りに、チームにフィットするのかが非常に楽しみな結果となりました。

スクリーンショット 2020-03-25 15.22.39

紹介する論文の内容は以上となります。実際にサッカーをプレイしていると、言語化できないあの選手とは"あう" / "あわない"という感情が生まれることがあります。そうした感覚を数値化する研究は素晴らしいと思いますし、選手獲得の際に参考とする予測値として非常に実用的だと感じました。

次回は、スペースの評価値であるEPVから守備陣形の弱点を発見する論文を紹介します。乞うご期待。

#スポーツアナリティクス #データ分析 #サッカー #SSAC20

この記事が気に入ったらサポートをしてみませんか?