見出し画像

【データ分析】データで振り返るUEFA Champions League Finalと、欧州サッカーのトレンド(基礎集計編)【statsbomb】

日本時間 8/24 4:00よりUEFA Champions League(通称 CL)の決勝が、ポルトガルのリスボンにて開催されます。COVID-19の影響もあり、レギュレーションの変更(準々決勝・準決勝がホーム&アウェー方式から中立地での1試合での決着に)を余儀なくされましたが、そんな中で勝ち上がったのは、ドイツとフランス、各リーグの絶対王者である、バイエルン・ミュンヘンとPSG(パリ・サンジェルマン)。両者ともに、質の高いタレントを擁しながらプレッシングとポゼッションを両立させた現代的なフットボールを展開するチーム。目が離せない一戦になりそうです。

そんな決勝を前に、本noteでは過去のCL決勝のデータをもとに、パスやトランジションの基礎集計から、欧州サッカーのトレンドを分析していきたいと思います。ダイレクト〜ポゼッション〜プレッシング〜総合型という戦術的な時代の変遷をデータからも裏付けられたらと。では本題へ!

0. データの仕様

今回使用したデータは、おなじみのstasbomb社提供のイベントデータセットです。[github]

- 対象コンペティション : UEFA Champions League 
- 試合数 : 03/04〜18/19の全決勝 14試合
- データの行数 : 52252(1試合平均 = 3732)
- イベントの種類(`type`) = [Pass, Ball Receipt, Carry, Duel, Pressure, Foul, Shot, Dribble, Interception等...]

1. パス

まずは、イベントデータのなかで最も件数の多いパスのデータから、CLの決勝の傾向を見ていきたいと思います。

1.1  チームごとの90分あたりのパス本数
(本当は積み上げたくなかったけれど、ライブラリの都合上...泣)

画像1

 傾向として、パスの本数においては横ばいというところでしょうか。突出していたのは、10/11 vsマンUのバルセロナの842本。シャビの1.5へ綺麗に1st.touchを置いてファンデルサールのニアを抜いたペドロ。両チームのパス本数の差も、462本で最多でした。

1.2 ポゼッションあたりのパス本数とパスの平均距離

画像2

上の散布図をカテゴリー分けすると、下記のように整理できるかと思います。傾向があるとは言い切れませんが、時系列的に最初と最後の勝者である03/04 ポルトと18/19 リバプールが似た特徴を持っていることから、フットボールがポゼッションを経て、ダイレクトにトレンドが回帰していることが伺えます。

- 左上 : ショートパス×スローなポゼッション = 10/11 バルセロナ、17/18 レアル
- 左下 : ショートパス×ダイレクトなアタック = 14/15 バルセロナ
- 右上 : ロングパスを織り交ぜたポゼッション? = 18/19 トッテナム、09/10 バイエルン
- 右下 : ロングパス×ダイレクトなアタック = 03/04 ポルト、18/19 リバプール

2. トランジションとデュエルの回数

2.1 トランジション数

画像3

statsbombから提供されているイベントデータには、`possession`というポゼッションの変遷を示す連番のカラムが存在しています。こちらの変化をトランジションの回数と定義して、試合ごとに集計したものが上の棒グラフになります。このトランジションの回数を示したグラフが、フットボールのトレンドを示しているのではないかと思います。

- 03/04〜06/07 : ダイレクト期 = 多
- 08/09〜10/11 : ペップバルサの登場によるポゼッション期 = 少
- 11/12〜13/14 : ドルトムント×バイエルンが印象的なプレッシング期 = 多
- 14/15〜 : 近年のトレンドである、フェーズ(ボール保持/非保持)をコントロールする総合型 = 少

2.2 デュエル数
また、デュエルの回数も同様に棒グラフにて可視化してみます。上で「印象的」と述べた12/13 クロップドルトムントの決勝のデュエル数が10年代だと突出しています。ダイレクト期を除くと横ばいと言えるでしょう。逆説的に、ダイレクト期のデュエル数の多さは、チーム戦術の欠落を意味しているのかもしれません。日本の高校サッカー?

画像4

3. サマリ

本noteでは、statsbombのイベントデータを用いた基礎集計にて、ダイレクト〜ポゼッション〜プレッシング〜総合型という戦術的な時代の変遷を見てきました。基礎集計レベルでも、定性的な情報(TLでの考察等)を裏付けるデータを抽出可能ということが分かりましたが、今後は下記のようなデータも集計・可視化することでトレンドを分析できればと思います。乞うご期待!(リクエストあれば、引用RTにてコメントください〜)

- 前進の手段(ロング〜ショート〜ドリブル?)
- シュートに至るまでの時間(短〜長〜短〜長〜短?)
- トランジションの発生頻度マップ(どこのゾーン?)

#spoana #スポーツアナリティクス #statsbomb #CL

この記事が気に入ったらサポートをしてみませんか?