これは「スポーツアナリティクス Advent Calendar 2019」の13日目の記事です。

「最もデータ分析と相性の悪いスポーツ、サッカー。サッカーのデータ分析はどこへ向かうのか」

 皆さんの超本格的なデータ分析の記事を読み、ビビっております。私は皆さんのように分析のプロでもデータ・サイエンティストでもなく、プロ目線の分析記事は書けませんので苦笑、ここではデータを使ったサッカーでの分析の「実際のところ」と、いやサッカーでのデータ分析って結構難くね?という話と、最後に皆さんへの「お願い」を書いていきたいと思います。


データは定性分析の補助と裏付けにとどまっているという現状

 「マネーボール革命」以降、様々なスポーツでデータ革命が起きてきました。バレーボールでは代表監督が片手にタブレットを持って指示を送る姿が当たり前になり、アメリカンフットボールではリアルタイム分析が勝利の鍵を握り続け、野球ではマネーボール革命から20年近くの年月を経て、「フライボール革命」が始まりました。しかし、サッカーでは、どうでしょうか。「分析」と呼ばれるというもののほとんどが、依然として定性分析、つまりデータによる定量的な分析ではなく、人の「眼」による主観的な分析がほとんどで、データ分析はそのような主観による分析の補助的な役割を担っている場合が多いです。リバプールFCはサッカーに「マネーボール」を持ち込み、「1試合に30回以上のクロス」「PA内で40回以上クロスまたはCKに合わせる」「ラスト35mで12回以上のボールを回収する」という分析を行い、クロスからのヘディングゴール数トップのアンディー・キャロル、クロス数トップのダウニング、セカンドボール奪取率トップのチャーリー・アダムを獲得し、結果として大失敗しました。せっかくロシアW杯ではタブレット等の電子機器のベンチへの持ち込みが許可されましたが、ほとんど使っている様子は見られず、テクノロジー部門の主役の座はVARに奪われてしまいました。スポーツ科学の最先端を突っ走り結果を残してきたはずのモウリーニョ監督ですら、「データは重要ではない。なぜなら、自分には『i-Analysis』があるからだ」と言っていました(テクノロジーの象徴であるiPhoneやiPadの「i・アイ」と自分の「eye・アイ」をかけ、自分の眼はデータより優れているという表現)。正直なところ、サッカーは「最もデータ分析と相性の悪いスポーツ」の一つだと言えます。なぜでしょうか?

 
リアルタイム分析は不可能に近い

 サッカーが圧倒的にデータ分析が遅れてしまう理由が、二つあります。一つは、「ブレーク」がないことです。これにより、リアルタイムでの分析活用にだいぶ限りが出てきてしまいます。バレーボールでは各セットの真ん中、各セットの終了後に加え、自分たちの意思で自由にタイムアウトを取ることができます。バスケットボールでも、各ピリオドの間、そして自分たちで取るタイムアウトという、リアルタイム分析をフィールドの中に落とし込む時間があります。野球では攻撃側は自分がバッターボックスまたは塁に出ていない時にたっぷりと共有する時間があり、アメリカンフットボールでは毎攻撃or守備のために、選手、ベンチ、監督、分析官が無線を通してミーティングを行っています。サッカーはどうでしょうか?常に試合は動き、時間が止まることはありません。ブレークと呼ばれるものは、間のたった15分のハーフタイムのみ。これでは、どんな優秀な分析官がいても、分析結果を共有することよりも、限られた時間の中で「どの情報は伝えないでも良いか」という方に考えていかなければなりません。アメフトのように、ボールを奪うor失うたびに全員でロッカールームに集まってどう攻撃or守備をするか話し合えれば良いのですが。


サッカーはカオス、再現性が極めて低い

 もう一つは、サッカーは「パターン」が通用しない、つまり再現性が極めて低いということです。「サッカーはカオスである」とは、よく言われていることで、制約がなく「何をしても良い」ゲームであるため、常にシチュエーションは変わり、ほんの小さなことが大きな違いになってしまいます。同じ試合は二度となく、選手経験者も指導経験者も、パターン練習がそのまま試合で起きたことがほとんどないことを、身をもって知っているはずです。バレーボールは絶対に3タッチ以内でボールは返ってくるし、野球は27個のアウトと9人の打者とその打順というものは決まっており、バスケは24秒以内にシュートを打たなければいけないため、ある程度のところまでパターン化ができ、再現性が高いスポーツです。サッカーは、何タッチしてもよく、誰の次は誰といったバスの順番が決められるわけもなく、何秒かけて攻撃しても構わないどころか、なんなら別に攻撃しなくても構いません。制約がないぶん、パターン化できず、再現性がほとんどないのです。こんな「カオス」な状態のものをデータ解析するのは、難しいのは当たり前のことです。


最後のフロンティア、セットプレー

 そんな中、唯一、サッカーの中で「再現性が高い」場面があります。セットプレーです。私自身は、セットプレーはサッカーではないと思っています。ゲームの形式、ゲームの本質がまったくもって異なるからです。いわば、サッカーというゲームの中で突然訪れる「ボーナスステージ」のようなものだと。特に、キックオフ、CK、ゴールキック、PK。これらは、開始される「場所」が常に同じであることなど、制約が多く、再現性が高いものです。だからこそ、セットプレーは「パターン練習」として、多くのチームが「作戦A」のようなパターンを仕込み、「キッカーが右手を挙げたら作戦B」のようなサインもあります。アメフトの攻撃に近いのかもしれません。実際、AI選手のプレーの自動採点を行う実験的な取り組みを行ったのですが、セットプレーは高精度でAIによる自動採点を行うことができました。これは、私の完全なる勝手な予感ですが、サッカーのデータ分析はどんどんセットプレーに特化していくのではないかと思っています。再現性が高く、しかもサッカーには珍しく「必ず訪れる」プレーだからです(どんなに攻め込まれている試合でも、1回ぐらいはCKのチャンスはあります)。何とか、ここにデータ分析を有効に使える余地があるのではないかと、考えております。というわけで、セットプレーのデータ分析に興味がある方、ぜひご連絡ください(笑)

 最後に、最近サッカー界で注目されているデータ「ゴール期待値」に関する面白いBBCの記事を貼っておきます。ここにはゴール期待値を当てるクイズが5問あります。動画が流れ、この場面でゴールが入るのは何%か?を当てていきます。5問中何問正解だったでしょうか?私の正答率は…あえて言わないでおきます(笑)
https://www.bbc.com/sport/football/40699431