見出し画像

#5 サッカーのスタッツは試合内容をどの程度表している?【データ分析の考え方】

今は多くのデータ会社があり、サッカーでも放送中にデータが映し出されることもよく見るようになりました。

JリーグではJ STATSがあったり、データスタジアムのようなデータ会社がデータを公開したりしています(Football LAB)。

「J STATS(ジェイスタッツ)はJリーグが認める、試合に関わる様々な競技データの総称。メンバー表や得点者、警告/退場といった試合記録に関わるものから、選手ごとのパスやドリブル、ボール支配率といったプレーに関するデータ、試合中の走行距離や選手のポジショニングなどの位置情報(トラッキングデータ)など、競技記録系データからパフォーマンス系データまでを含む。

J.LEAGUE公式サイト

Football LABでは項目と定義についても記載しています。

Football LAB

このように、トップリーグとなるとそこそこの項目数が公開されます。

たくさんデータがあってすごいなーと思う一方で
どう解釈すればいいの?
と思う人もきっといると思います。

また、
自チームでもこのようなデータを取ったほうが良いの?
もしくは
データを取ってはいるけどどう解釈すれば良いのか?
と悩んでいる人もいるかもしれません。

そこで今回の記事では

スタッツ(データ)の解釈

について解説していきます。

スタッツの解釈の仕方がわかると
データが試合内容をどの程度表しているのかがわかります。

結論としては

スタッツは試合内容を的確に表しているとは言い難いけど、ちゃんと見れば分析の観点を提供してくれる

というものです。


そもそもデータは抽象的

データ、数字と言えば具体的なものであるという見方も考え方によってはできるのですが、根本的に数字は抽象的な概念です。

例えば人間と冷蔵庫は多くの差異がありますが、個数として数字でまとめることはできます。

多数の差異という情報を低減して、数字に変換する(抽象化する)ことで計算をしたり、解釈の難易度を下げたりしています。

これは人間を数える時でも同じです。

人間同士であっても具体的に見ると多数の差異がありますが、数字として抽象化しているということです。

サッカーの例

サッカーでいうと、シュートを例にとれます。

例えばシュートを10本打ったというデータがあったとしても
1本1本は状況が大きく異なる(差異が多い)でしょう。

しかし、そういった状況はひとまず置いておいて
何本シュートを打った」という抽象的な情報に変換しているのです。

なので、シュート数だけでは攻撃がうまくいっていたかどうかや、どちらが優勢だったかを推察することは難しいのです。

つまり、簡易なスタッツでは試合内容をかなり大まかにしか把握することはできないことになります。

どうすればより試合内容を反映したデータにすることができる?

それには

データの解像度を上げる

という作業が必要になります。

先ほどのシュートの例で言えば、シュートを打った本数だけでなく、

  • シュートを打った場所

  • シュートに至るまでの攻撃種類

  • シュート時の相手DFとの距離や角度

  • シュート部位

などのように詳細に記録することで、
シュート状況を詳細に記述することができるようになります。

これが解像度が上がるということです。

画素数が増えると映像が綺麗になる感じですね。

そのため、測定項目が多くとることができれば試合内容が比較的反映されやすいと言えます。

ゴール期待値(xG)は良い例です。

ただし、当然ながら項目数を多くするとデータ量も増えるので、データの取得や処理がとても大変な作業になります。

データ会社や研究者でないとなかなか手が出せないのも事実です。

さらに言えば、データをどれだけ詳細に取ったとしても試合内容を完璧に表すことはできません。

世界はアナログなのでデジタルにする時点で少なからず情報を削ぐことになるからです。

じゃあデータをとる作業は意味ない?

そんなことはありません。

上述したような、データ(スタッツ)の限界をきちんと理解していれば、推察の精度は上がります。

データが粗ければ粗いほど(項目数が少なければ少ないほど)、モザイクが強くかかったような状態になりますが、その状態でも気になる部分を見つけてアナログで見直せば良いのです。

つまり、

シュート数が多いのに勝てなかった

という場合では
シュートシーンを全て見て、なぜ入らなかったかを主観的に考えれば良いということです。

最終的には主観(質的)分析が必要になる

先ほど書いたように、データをどれだけ詳細に取ったところで試合内容を完璧に反映させることはできません。

また、現実的に考えて、予算や時間・人が潤沢にない限りはデータを詳細にとることは難しいです。

そこで重要になるのは主観的(質的)な分析になります。

数字のような量的データと主観的分析は補完関係にあります。

この点に関しては以下のブログ記事に詳細を書いています。

【ゲーム分析手法】質的分析と量的分析はどちらを優先するべきか

量的データが多くとれない場合は、主観的分析の割合と精度を高めれば良いのです。

ただ、量的データが主観的分析では見つけにくい分析観点を提供してくれることもあるので、個人的には量的データも出来うる限り取ったほうが良いと思っています。

まとめ

はじめに書いたように、
「スタッツ(データ)はどの程度試合内容を表しているのか?」
という疑問に対する結論としては

スタッツは試合内容を的確に表しているとは言い難いけど、ちゃんと見れば分析の観点を提供してくれる

というものです。

主観的(質的)分析の精度と量的データに関する理解を高めていくことが

総合的な分析の質を高めてくれます。

以上、ご精読ありがとうございました。

この記事が気に入ったらサポートをしてみませんか?