見出し画像

【スポーツアナリティクス】「時間とスペースを味方へ配る」を定量化したかった(EURO2020でのペドリを添えて)【statsbomb 360】

 この記事はスポーツアナリティクス Advent Calendar 2021 4日目の記事です。また、昨年度の同カレンダーでの記事は下記リンクからたどれます。

 ということで、3年目となったアドベントカレンダーはタイトル通り、サッカーにおける『「時間とスペースを味方へ配る」を定量化したかった(EURO2020のペドリを添えて)』を、下記の構成でお送りしたいと思います。また、いろんな人に読んでいただける願望を込めて、対象読者ごとにこんな視点で読み進めてもらえればなというリストを先に提示させてください。

他競技のアナリストさん
サッカーのトップカテゴリでは、
こんなデータがオープンになっているんだな〜
うちのスポーツに置き換えるなら、こんな分析ができそう?

サッカーのアナリストさん、指導者の皆さん
相手の配置がデータで表現されているなら、
あの事象もデータで定量化・評価することで、
選手へのフィードバックやスカウティングに使えないかな?

つよつよデータサイエンティストの皆さま
ラベルなし・欠損ありの連続的な座標データへの選手分類をするなら、
この方針で実装・実験するかな〜(ひとまずアノテーション?)

対象読者ごとに持っていただきたい視点

1.分析のモチベーション

 ボールを奪い合い・保持し、相手より多くゴールを決め、勝利を掴むスポーツであるサッカーにおいて、「時間とスペースを味方へ配る」ことのできる選手は非常に重要だとされています。TV解説の方が言われる”綺麗にボールがつながってゴールが決まった”シーンは、ボールをつないで「時間とスペースを味方へ配る」ことが連続していることが多いのですが、映像からそのプレイを言語化するのは、”分析眼”が必要になります。そんな重要なアビリティを、定量化して評価せずに放っておくのは、アナリストとしてはナンセンスですよね。そんなモチベーションのもと、本分析は始まりました。

2.StatsBomb 360データのフリー公開

 そもそも、今年はアドベントカレンダーを書かない方向でいましたが、サッカーのデータ分析界をリードし、データのオープン化で盛り上げてくれているStatsBomb社からの「EURO2020のStatsBomb360 Dataをフリーにしたよ!」というツイートが本noteの執筆のきっかけとなりました。

 このデータにどういった目新しさがあるのかというと、一昨年のアドベントカレンダーのnote内で使った「サッカーにおける定量データ」使った画像に、黄色背景・赤文字で付け足した部分がそれにあたります。今までStatsBombからフリーで提供されていたのは左下の「パスやシュートといったイベントに関する各種情報のみ」だったのですが、それに加えて今回のStatsBomb 360データでは、イベントが発生したタイミングの「一部の選手のみの位置情報データ」が追加で提供されています。

サッカーにおける定量データの紹介(追記版)

 こうすることで、下記画像のように、選手間のパス交換における味方と相手の一部の選手の位置を、データとして扱うことができます。いままでは、パスのイベント発生地点(×)のみしか提供されていなかったのですが、そのイベント発生時の味方(赤丸)・相手選手(白丸)の位置の確認が可能になり、いわゆる相互作用で選手が判断してプレイしているサッカーにおいて、分析の幅がグッと広がりました。(赤い網掛けは座標データが取得できている範囲)

EURO2020 準々決勝 スペイン×クロアチアのワンシーン(攻撃方向→)

 分析の幅が広がったと思うなら、やるしかないっしょ!ということで、1.分析のモチベーションで綴った「時間とスペースを味方へ配る」のが、現代サッカーで最も上手いと自分が定性的に分析しているバルセロナ所属・スペイン代表のペドリ(19)にフォーカスを当てて、定量化を試みたいと思います。余談ですが、リーグ戦とEURO2020、さらには東京オリンピックでの活躍が認められた彼は、若手版バロンドールも受賞しており、今後のさらなる成長が期待されています。(非サッカーファンにもイチオシのペドリです、サッカー通ぶれますよ!笑)

3.「時間とスペースを味方へ配る」を定量化したかった

 1.と2.では意気揚々と、分析へのモチベーションとデータセットの紹介をしていたのですが、本note執筆2日前からデータを本格的に触り始めるという夏休み終了の直前の小学生のような過ごし方をしてしまい、「時間とスペースを味方へ配る」能力の定量的な評価を、定量化し、複数の選手の間で比較・分析をするに至れませんでした。その要因はもちろん自分の分析にかけた時間の少なさもあるのですが、StatsBomb 360データの仕様にもなかなか難しい部分がありました。

 主に困った部分としては2点で、1.各シーンにおいて座標を取得できている選手数にばらつきがある点(=欠損)と、2.シーン間の選手の対応関係が取れない点(=ラベルなし)です。例として、クロアチア戦のペドリの一連のプレー(ウィークサイドへのサイドチェンジ)を可視化して確認することとしましょう。左上から右下にかけて、連続した4つのイベントとそれに紐づく360データを可視化しているのですが、①は7人、②は8人と各シーンで相手選手数が異なり、サイドチェンジでボールを受けた(④)選手が、①のシーンでどこにいたかのラベルは、目視で確認するしかありません。これにより、「スペースと時間を味方へ配る」というアビリティを正しく測るには、複雑な処理を施す必要があることがわかりました。

クロアチア 3-5 スペイン 前半12:50 ペドリのサイドチェンジ(攻撃方向→)

 ここで終わり!とは言えない性分なので、今回の分析で測ろうとしていた2つの尺度を、別のシーンで紹介しながら今後の方向性の議論のタネにできればと思います。それは、ペドリがパスを受ける前とパスを出した後での「A. 相手守備陣形の広がり」と「B. パスを受けた選手の時間(相手のプレスがない)と位置(なるべく前方)の解放度」でした。(非常に硬い表現で苦手)

 下のシーンだと、ペドリがボールを受ける前と後で、「A.相手守備陣形の広がり」は大きくなり(特に横方向)、「B. パスを受けた選手は、なるべく前方で相手のプレスのない(=攻撃方向に相手がいない)状況」になっていると、プロットから定性的に考察できるかと思います。この2つの概念を、データから表現できないかと、リサーチしながら検討します、、、

スイス 1-1 スペイン 後半00:30 ペドリの「スペースと時間を配る」(攻撃方向→)

4.サマリ

 実はこの「時間とスペースを味方へ配る」という表現は、サッカーの指導者・分析界隈でNo.1の知名度を誇る、らいかーるとさんからの受け売りというネタバレを最後にさせていただければと。笑

 ただ、前述の通り、このStatsBomb 360データの登場で、サッカーというスポーツをデータから分析する幅が広がったのは言うまでもないので、引き続き現場で戦う仲間たちやSNSで交流してくださる皆様と議論しながら、より実用性の高いデータ分析の手法を構築できれば!と考えます。最後に持っていただきたかった視点を再掲しながら、引用RTにてコメントを添えながら共有いただけると嬉しいです!!インタラクティブに!

他競技のアナリストさん
サッカーのトップカテゴリでは、こんなデータがオープンになっているんだな〜うちのスポーツに置き換えるなら、こんな分析ができそう?

サッカーのアナリストさん、指導者の皆さん
相手の配置がデータで表現されているなら、あの事象もデータで定量化・評価することで、選手へのフィードバックやスカウティングに使えないかな?

つよつよデータサイエンティストの皆さま
ラベルなし・欠損ありの連続的な座標データへの選手分類をするなら、この方針で実装・実験するかな〜(ひとまずアノテーション?)

対象読者ごとに持っていただきたい視点

 これまでの/これからのアドベントカレンダーは下記リンクから。全日程終了したら全部読みます!笑

#アドベントカレンダー2021 #スポーツアナリティクス #statsbomb  


この記事が気に入ったらサポートをしてみませんか?