見出し画像

[全文]大好きな横浜Fマリノスの2020年をデータ分析で振り返る

こちらの記事では、2020年J1リーグでの横浜F・マリノスの全試合に関するデータの一分析方法とその分析結果を紹介しております。気がついたら10000文字を超える非常に長い記事になっていました。そのため、目的に応じて目次から読む章を選んでいただくことをお勧めします。特に、5章と6章はかなり長い内容になっております。お時間のある方は、最初から通して読んでいただいても構いません。想定する読者ごとに、お勧めの読み方を記載しておきます。

1. マリノスのデータをたくさん知りたい!(ほとんどのJリーグサポーターの皆さんがここかと思います)
 1,2,3,4章で背景や前提知識を知った後、6章に移動して分析結果を読む

2. とにかく時間がないの!早く分析結果を見せて!
 6章に移動して分析結果を読む

3. データ分析手法に興味がある!
 1,2,3,4,5章を確認後、データセット(csvファイル)やGoogle Colabのノートブックを読む

4. データ分析手法もマリノスの分析結果も興味がある!
 1章から通して読み、データセット(csvファイル)やGoogle Colabのノートブックも読む

5. なんか面白そうで、時間もあるから読んでやるか
 1章から通して読む


1.はじめに

初めまして。横浜F・マリノスが大好きな20代の社会人です。マリノスの今シーズンも終了しました。アンジェ・ポステコグルー監督になってから、これまで守備が強いイメージがあるサッカーから攻撃的なサッカーに変換し、得点が増えてきたこともあり、マリノスのサッカーが面白くなりました。私は学生の頃もマリノスの試合を観戦することが好きで、スタジアムでの観戦やDAZNでのフルタイム観戦を毎週のようにしておりました。しかし、社会人になったこともあり、フルタイムで試合をみれる回数も減ってきました。そのため、誰が良いパフォーマンスを出していたのか、以前のように正確に把握することもできてないのが現状です。

試合を見れなかった時は、出場メンバーや得点者、得点時間などをマリノス公式サイトやスポナビなどで確認したり、YouTubeでのハイライト映像を見たりしています。最近では、選手のスプリント数など、パフォーマンスに関するデータが増えてきましたね。DAZNでは、ハーフタイムで紹介される攻撃エリアや走行距離などが表示され、選手についてのデータが知れて楽しいですよね。その影響もあり、最近さらにいろんなことをデータとして知りたいと思うようになりました。例えば、誰と誰のコンビで得点をよく決めているのか、全試合を通じてどの時間帯に得点を決めているのか、など、わかっていそうでわかってないことをデータとして知りたいと思ってきました。(おそらく、Jリーグのクラブ側ではこのようなデータはすでにチーム内で共有され、戦術の決定などに活用されていると思われます。)

最近では、スポーツ分野でのデータ分析の記事が多く出てきてます。直近では、スポーツアナリティクスのアドベンチャーカレンダーが作成され、多くの方が記事を投稿されております。とても興味深いですね。サッカーも例外ではなく、筑波大学蹴球部のお話など、すごく興味深い記事が投稿されていました。

一方で、データ分析をメインとした記事では、私の大好きなマリノスに特化した分析記事はほとんど見当たらず、物足りなさを感じる自分がいました。他のJリーグサポーターの方も共感してもらえると思いますが、自分の好きなチームのことをもっと知りたい気持ちが高まる瞬間ってありますよね。そこで、Noteでマリノスに関する記事を検索して見たところ、結構いろいろな記事が出てきました。中には毎試合レビューを記載している方もいらっしゃりました。記事の内容も面白くて、すごすぎる。。。しかし、Noteでのマリノス関連の記事は、各試合の解説や感想を伝える記事が多い印象を受けました。そこで、全試合を通じたデータの分析にフォーカスした記事があれば楽しそうだと思いました。

今年は、コロナの影響もあり、週末や年末年始に時間が確保できるようになってきました。そこで、冬休みの自由研究として、マリノスの試合を様々な角度から分析してみようと思いました。私は、データ分析の専門家ではありませんので、簡単な分析のみを実施しました。この分析結果を公開することによって、マリノスサポーターのみなさんや他のJリーグサポーターのみなさんに、より深くマリノスについて知ってもらい、来年度のマリノスの試合をより楽しんでもらう材料にしていただければ幸いです。また、マリノスのデータ分析はとても楽しく、手軽に(ちょっと疲れます)できるものでした。そのため、分析の手順やデータセットなどについても記載し、みなさんにも好きなチームの分析をぜひ分析していただければ幸いです。

ここから紹介する内容を簡単にまとめます。まず、2章でデータ分析と記事を投稿する目的について整理します。次に、3章で今回のデータ分析範囲について紹介します。その後、4章で本記事で活用する用語を説明した後、5章でデータ分析の流れを紹介します。データ分析に興味がある方は、5章も読まれることをお勧めします。最後の6章で分析結果と考察を記載します。6章では、マリノス以外のサポーターの方にも楽しんでもらえるよう、マリノスの失点に関する分析結果なども記載しております。分析方法の詳細は知らなくてもいいから、マリノスの分析結果を知りたい方は6章からを読んでいただいても十分に楽しめると思います。少し長めの記事になっておりますので、お時間がない方などは目次から興味のある場所に移動して読んでいただければと思います。

2. 目的

目的を整理させていただきます。データ分析を実施する目的と、記事を公開する目的について整理しました。

データ分析の目的

・今シーズンのマリノスの試合データを様々な角度から分析し、選手やチームの活躍、及び選手やチームの改善点などをデータとして明確にすること。これにより、今までなんとなく理解していたマリノスの特徴のより明確な把握、全く気がつかなかったマリノスの特徴の把握により、来シーズンのマリノスの試合を見る新しい注目ポイントを発見する。

記事を公開することの目的

・マリノスサポーターやJリーグサポーターが把握しきれてなかった今シーズンのマリノスに関する情報をデータとして可視化すること。これにより、来年度のマリノスのサッカーを見る際の新しい注目ポイントなどを提供し、来シーズンより楽しんでJリーグをみてもらえるようになること。

・データ分析の流れを紹介し、誰でも気軽にデータの分析ができることを知ってもらうこと。これにより、多くのJリーグサポーターの方にデータ分析を楽しんでもらえるようになること。

3. 今回のデータ分析範囲

今回のデータ分析では、皆さんが把握できてない情報をデータとして可視化することに価値があると考えております。そのため、すでに公開されているデータ(Jリーグ全体の得点ランキング、出場時間ランキング、...)は、すでにご存知かと思われますので、独自のデータセットを作成することにしました。

誰でも真似できるような分析を実施したい点、勤務時間もあるため限られた時間で分析を実施する点、データ分析環境の難しい準備や資金の用意ができない点、これらを考慮してデータ分析範囲を絞ります。今回は、誰でも簡単にアクセスできるデータの活用したデータセットの作成、短時間(約1ヶ月ほどの空き時間)で分析可能なデータ量、簡単な環境かつ無料で活用できる分析ツールの活用を目指しました。その結果、今回のデータ分析範囲としては、下記のように設定しました。

対象とするデータ

# 対象とするデータ
- 分析対象チーム
 - 横浜Fマリノス
- 対象の試合
 - 2020年J1リーグ34試合を対象
- 分析対象シーン
 - 得点シーン
- 使用データ(詳細は分析方法の章で後述)
 - YouTubeで提供されるハイライト映像
 - スポナビのゴール情報
 - Jリーグ公式の選手情報

# 理由
- 今回は好きなチームの分析に特化
 → マリノスの試合のみに注目
- ACLやルヴァンカップなどを含めると、データ収集の時間がかかること、分析の基準などで後々ややこしくなりそう
 → 今回はJリーグの試合のみに注目
- 試合でもっとも重要なことはゴール
 → ゴールシーンのみに注目
- 他の人でも分析ができるようにしたい
 → 簡単に手に入るデータを活用

使用する分析ツール

# ツール
- Google スプレッドシート
- Google Colaboratory

# 理由
- Googleアカウントさえあれば、どちらのツールも誰でも無料で活用できる。
- Googleスプレットシートは、Excelと同じように活用でき、新たに覚えるスキルがほとんどない。
- Google Colaboratoryは、分析環境がすでに整えられており、Googleさんのマシンをお借りして動かせるため、自分のPCにChromeやSafariが入っているだけで分析ができる。

4. 用語説明

以降の内容でデータの意味を表す際に、特別に表現している用語があります。そのため、事前に活用する用語について簡単な説明を記載しておきます。本記事以外では、これらの表現が使われるとは限りませんので、ご注意ください。

- 準アシスト
 - ゴールのアシストをアシストすることを指す。ゴールをアシストをした選手に対して、直前にパスを出した選手のこと。

- 得点関与ランキング
 - 得点、アシスト、準アシストの合計数でのランキング

- Play
 - 試合での状況を表す用語として活用。FKやCKではなく、選手がパスを回している状況などのボールが動いており、プレーオンの状況を指す。

- 0(背番号)
 - 得点者のデータには、0番を表すデータが含まれる。これは、オウンゴールを指す。

- NaN
 - 記録が取れてないことを指す。つまり空欄であることを指す。
 - ハイライト映像では確認できないケース、またそもそもPKのゴールでアシスト者や準アシスト者が存在しないケース等でも表示される。

- ...
 - 他に勝手に独自の表現を使っているかもしれません...

5. データ分析の流れ

データ分析の流れは下記の順番に実施していきます。少し長めの内容になっております。表などの細かい部分は確認しなくても大丈夫です。

- 知りたいことの抽出
- 分析内容・意図の明確化
- データセットの作成
- 分析作業

5.1 知りたいことの抽出

まずは、データ分析によって知りたいデータを決めます。今回のデータ分析の目的は、来シーズンの試合をみる新しい観点を発見するために、今までなんとなく理解していたマリノスの特徴のより明確な把握、全く気がつかなかったマリノスの特徴等の把握をすることです。以上の目的を考慮し、自分自身の主観に基づき、皆さんが知っているようで知らないことや、全く知らないから知ってみたいことをざっと書き出した後、今回のデータ分析範囲で取得できそうな範囲で絞り込んでみました。少し雑ではありますが、下記に知りたいデータの一覧を記載しました。

(知りたいデータについては、みなさんまだまだたくさんあると思います。今回の記事で興味を持っていただけたなら、ぜひ皆さんもデータ分析を試してみてください。)

- ホームやアウェイ別に得点ランキングやアシストランキングを知りたい
- 誰とのコンビで多くの得点を取っているのか?
- アシスト者と準アシスト者のコンビランニング
- 誰がどの対戦チームから得点を取るのが得意なのか?
- 得点の変動を時間軸とともにグラフで確認したい。
- 準アシスト者は誰が多いのか知りたい。
- 誰がボールを奪われて失点しているのか知りたい。
- マリノス戦では相手チームの誰が一番多くのゴールを決めたのか?
- マリノス戦では相手チームの誰が一番多くのアシスト、準アシストを決めたのか?
- ボールを奪ってから何秒くらいで得点しているのか?
- ボールを奪われてから何秒くらいで失点しているのか?
- どんな状況で得失点が発生しやすいか?
- ...

5.2 分析内容・意図の明確化

上記で、知りたいことをざっくりと書き出しました。これらの知りたいことに基づいて、今回分析によって取得したいデータを表にまとめます。以下の表では、データの分類、取得するデータ、データを取得する意義、分析結果の予想を記載しました。興味のある方はご覧ください。(Noteでの表の作り方が分からなかったので、画像で貼り付けました。)

分析内容まとめ1

分析内容まとめ2

5.3 データセットの作成

上記の表でまとめたデータを取得するために、データを集める必要があります。しかし、上記のデータを取得するためには、公開されたデータだけでは足りない可能性があります。また、試合データを整理されたcsvファイルなどでの提供がされているサイトを知りません(知っていたら教えてください)。そのため、今回は自分でデータセットを作成します。また、誰でも再現しやすいよう、アクセスしやすいデータのみを活用することとしました。

対象とするデータソースは下記の通りです。

- YouTube
 - https://www.youtube.com/playlist?list=PLRQRAGI8nBpB4cMV3oiABxM5opg52VKEN
 - 得点時間やゴール者、アシスト者、準アシスト者、ボールロスト者、ボールカット者、ゴールが入るまでの時間、などなどを取得

- スポナビ
 - https://soccer.yahoo.co.jp/jleague/teams/schedule/124
 - 得点時間や選手の背番号を取得

- Jリーグ公式サイト
 - https://www.jleague.jp/club/yokohamafm/profile/
 - 選手の情報(選手名と背番号など)を取得

これらのデータソースから、今回分析に活用するデータセットを作成しました。分析用に準備したデータ一覧を下記の表で紹介します。

データセットの各データ一覧

上記の項目のデータをデータソースから取得し、独自のデータセットを作成しました。こちらのデータセットは下記のリンクで公開しております。興味のある方はご確認いただければと思います。二つのシートに別れており、一つ目はマリノスの選手に関する情報(Jリーグ公式サイトからコピペしました。)、二つ目は上記の表で記載した項目を手動で入力したデータセットです。今回は、Googleスプレットシートを活用していたのですが、CSVファイルとして保存したものを公開させていただきます。

5.3.1 データセットに関する注意点

今回のデータセットは私個人が作成したデータセットになっております。そのため、誤ったデータが含まれていることや、人によって解釈が異なるデータも含まれていることにご注意ください。

人によって解釈が異なるシーンをいくつかピックアップして説明したいと思います。

シーン1

第30節の川崎フロンターレ戦の1失点目です。川崎の選手がクロスを上げたボールを、扇原選手がクリアしようとしましたが、川崎の選手の元にボールを渡してしまい、失点してしまいました。このシーンですが、私のデータでは、扇原選手がボールロスト者として記録をつけております。(ボールをロストしたと言えるのが、なかなか難しいケースだと思います。)

シーン2

第28節のFC東京戦の3点目です。こちらは、水沼選手が蹴ったボールがFC東京の選手に当たってオウンゴールになりました。このシーンですが、私のデータでは、水沼選手がアシストした記録をつけております。(公式ではおそらくアシストがついてないと思います。)

シーン3

第34節の横浜FC線の1点目です。前田選手が上げたクロスをオナイウ選手がシュートし、ポストにあたったものの、再びオナイウ選手がシュートしてゴールを決めました。このシーンですが、私のデータでは、前田選手がアシストした記録をつけております。

このように、人によって解釈が異なるシーンがあり、公式の記録とは若干異なる数値が出ている部分もございます。私の分析結果は、公式記録ではないということを御留意いただければと思います。

5.4 分析作業

データセットが整ったら、いよいよ分析作業に入ります。今回分析に使ったツールを再度紹介したいと思います。

- Googleスプレッドシート
 - Web上で使える無料のExcelと捉えてOK
- Google Colaboratory
 - Web上で使えて、無料で使えて、すでにいろんなツールが導入されたプログラミング環境

いずれも、Googleアカウントさえあれば誰でも簡単に無料で活用できる優れものです。Googleスプレッドシートは、GoogleのExcelと捉えてもらって大丈夫です。Excelさえ使ったことがあれば、誰でも簡単に使えます。Google Colabは、プログラミング言語で記載したコードとテキストを混ぜて記載することができたりと、とても便利なツールです。特別な環境構築はほぼいらないため、すぐにPythonのコードを試すことができます。

ここからは、実際にデータを分析するために、ちょっとしたプログラミングを行います。この記事では、プログラミング方法を紹介することが目的ではないため、詳細の記載は避けようと思います。ただし、皆さんにも試していただきたいので、Google Colabで作成したコードを公開しようと思います。

(こちらのコードは、データセットをGoogle スプレッドシートから直接読み込むようにしております。そのため、今回提供したcsvファイルを読み込む場合には、Googleスプレットシートにcsvをコピペする、またはcsvファイルを読み込むコードを書く必要があります。(参考リンクを貼っておきます))

プログラミングをしたことない人であれば、プログラミングの中身を理解する必要は全くありません。雰囲気だけを掴んでいただければと思います。

ざっくりと簡単にプログラミングの概要を説明します。

- プログラミング言語
 - Python3

- 主な使用ツール
 - gspread
  - スプレットシートをGoogle Colab上で活用するためのツール
 - pandas
  - 表データなどを計算しやすい形で扱えるツール
 - matplotlib
  - pandasなどに格納したデータをグラフ化するツール

コードの中身についてですが、綺麗さなどはあまり考えず、とにかくGoogleで調べて、コードを貼り付けて、...を雑に繰り返したコードになっております。私自身、Pythonのツールを使い慣れていなかったことやプログラミング経験自体が浅いこともあり、プログラミング経験者の方は、超雑なコードだな...と思ってしまうかもしれません。(雑にコードを書いて試せる点がColabやJupyter Notebookなどのツールの良さでもあるかもしれません。)(自分の環境にコピーして好きにプログラムを変更していただいて構いません!)

6. 分析結果

お待たせしました。それでは、分析結果を紹介したいと思います。今回の分析結果はとても多いですので、5.2章の表でまとめた内容を紹介しきれないと思いました。今回は、皆さんがあまり知らなさそうな結果にフォーカスして紹介していきたいと思います。分析結果に関しては、Google Colab上で全ての結果が確認できますので、気になる方はご覧ください。
(表やグラフが綺麗になっておらず、結果を確認しにくいところが多々あるかと思います。また、こちらの分析結果は自作のデータセットになっており、公式の分析結果とは異なる可能性がございますことを御留意ください。)

6.1 基本的なランキング

まずは、基本的なランキングデータ(ゴールランキング、アシストランキング、準アシストランキング、得点関与ランキング)をこちらに記載します。基本的なランキング(特に得点とアシストランキング)に関しては、既にご存知かと思いますので、細かく紹介しないことにします。分析結果のまとめた図を最初に貼っておきます。小さいと思いますので、拡大して確認していただければ幸いです。

スクリーンショット 2020-12-25 0.23.34

得点ランキングとアシストランキング

得点ランキング、アシストランキングはみなさんご存じたと思うので、少しだけ触れることにします。

得点は、エリキ選手、ジュニオールサントス選手、マルコス選手が2桁得点を記録しました。得点はブラジル人に支えられましたね。

アシストは、水沼選手は12アシストです。(公式記録とは異なるはずです。理由は、5.3.1のデータセットに関する注意点をご確認いただければと思います。)さすがですね。その後ろにティーラトン選手、仲川選手が6アシストとなっております。やはりサイドプレーヤーがアシストする傾向があります。

準アシストランキング

次に、準アシストランキングを紹介します。準アシストとは、アシストをアシストした選手のことを指します。こちらは、あまり分析された例が少ないと思いますので、少し詳しく見ていきましょう。

スクリーンショット 2020-12-25 19.21.06

NaNとなってるところは、記録が取れなかったことを指しております。ハイライト映像だけでは、編集でカットされていたりと、準アシスト者を確認できないシーンも多くあったことを先に伝えておきます。

準アシストランキングは、天野選手が8回、扇原選手が6回と上位陣が並んでおります。やはり中央から得点の起点となるパスが提供されているんだと確認できました。中央からサイドにボールが出た時は、目が離せませんね。

得点関与ランキング

次に、得点関与ランキングを紹介します。得点関与ランキングとは、得点、アシスト、準アシストの合計数でのランキングのことです。こちらも、あまり分析された例が少ないと思います。

スクリーンショット 2020-12-25 19.22.28

上位は、ジュニオールサントス選手、エリキ選手、マルコス選手がきました。さすがですね。ブラジル人に助けられてことがここからもわかりますね。その後ろには、水沼選手、天野選手、オナイウ選手が並んでいます。それぞれ2桁のゴールに関与していることがわかりました。水沼選手、天野選手、オナイウ選手は、今シーズンフルで出場している回数は多かった方ではない印象があります。それなのに、上位に出てくるのはさすがとしか言いようがありません。選手層が厚いことが現れていますね。

6.2 スタジアム別ランキング

スタジアムごとに活躍する選手を確認しておきたいものです。次にスタジアム別に分析した得点に関する基本的なランキングデータ(ゴールランキング、アシストランキング、準アシストランキング、得点関与ランキング)を紹介します。

得点ランキング

スクリーンショット 2020-12-25 19.27.02

日産スタジアムでは、エリキ選手が7得点を記録しました。来年の日産スタジアムでの試合は、特にエリキ選手に注目しましょう。

アウェイでは、ジュニオールサントス選手が6得点を記録。アウェイで頼れる男はかっこいいですね。

ニッパツでは、エリキ選手は3得点。ホームで強いエリキ選手。

アシストランキング

スクリーンショット 2020-12-25 19.27.31

日産スタジアムでは、水沼選手が6アシストを記録。マリノスに復帰した年なのに、これだけ日産スタジアムで輝けるのはすごいです。来年も美しいクロスが楽しみです。

アウェイでは、仲川選手が5アシストを記録。怪我でなかなか出れてない印象でしたが、アウェイでこれだけの数字を取れる男、頼もしいですね。

ニッパツでは、水沼選手が3アシストを記録。ホームで強い水沼宏太選手、素敵です。

準アシストランキング

スクリーンショット 2020-12-25 19.28.38

日産スタジアムでは、扇原選手が4回の準アシストを記録。日産では、扇原選手がボールをもったら、ゴールの起点になりそうと期待できますね。

ニッパツでは、天野選手が3回の準アシストを記録。これからも純アシストたくさん見たいです。

アウェイでは、マルコス選手が3回の準アシストを記録。アウェイでもゴールの起点になれる男ですね。

得点関与ランキング

スクリーンショット 2020-12-25 19.29.41

日産スタジアムでは、ジュニオールサントス選手が12回を記録。途中加入でしたが、日産スタジアムでとても輝いてくれました。来年も残って欲しい。

アウェイでは、マルコス選手が10回を記録。アウェイでのマルコス選手に来シーズンも目が離せません。必殺技パフォーマンスも見たいところ。

ニッパツでは、天野選手が6回を記録。ニッパツでのあまじゅんのゴールが来年も見たいです。

6.3 コンビランキング

どの選手同士で得点に生み出しやすいか気になりますよね。ここでは、コンビランキングを紹介します。得点とアシストのコンビ、アシストと準アシストのコンビのランキングを紹介します。

得点-アシストのコンビランキング

スクリーンショット 2020-12-25 19.43.30

得点-アシストのコンビは、エリキ選手-ジュニオールサントス選手のコンビ、マルコス選手-仲川選手のコンビが3回で上位でした。

アシスト-準アシストのコンビランキング

スクリーンショット 2020-12-25 19.43.51

アシスト-準アシストのコンビは、高野選手-扇原選手のコンビ、水沼選手-オナイウ選手のコンビが3回で上位でした。

コンビランキングをみた結果、意外と特定のコンビで得点を量産しているわけではないことが確認できました。つまり、誰が出てもいろんなパターンの得点が取れるチーム、ということだと思います。素敵です。

6.4 ボールロストランキング

得点に絡んで活躍する選手は大体確認できてきました。次は、誰か失点に直接関与していたか、知りたくなってきますね。こちらでは、失点につながるボールロストのランキングを作成しました。マリノス以外のサポーターのみなさん、お待たせしました。来年のマリノス戦をみるポイントして活用できそうなデータをご用意しました。お楽しみください。

ボールロストランキング

NaNとなってるところは、記録が取れなかったことを指しております。ハイライト映像から確認できなかったシーンは、NaNが入っております。

ボールロスト回数を一位は、扇原選手でした。扇原選手からボールを奪われると、失点に近くと考えて良いかもしれません。また、上位には、サイドバックとセンターバックの選手が入ってますね。当たり前ですが、DFの選手がボールを奪われたら、失点しやすいということですね。

6.5 対戦相手別のランキング

対戦相手ごとの相性は選手もありますよね。そこで、マリノスの選手が相性の良い対戦相手を確認します。こちらでは、対戦相手ごとの得点関与ランキングを紹介します。マリノスサポーターの方は、対戦相手ごとに注目選手を整理しましょう。マリノス以外のサポーターのみなさんは、来年のマリノス戦で気をつけるべき選手をぜひチェックしてみてください。

マリノスの選手の得点関与ランキング

スクリーンショット 2020-12-25 19.53.24

ランキング上位では、浦和レッズに対して水沼選手、ジュニオールサントス選手が5回、湘南ベルマーレに対して天野選手は4回得点に関与していました。それぞれ来年の試合で注目選手ですね。

6.6 対戦相手の選手ランキング

ここでは、対戦相手の選手の活躍にフォーカスします。マリノス戦だけの得点ランキング、アシストランキング、準アシストランキング、得点関与ランキングを作成しました。マリノスサポーターの方は、来年気をつけるべき選手を整理しましょう。そして、マリノス以外のサポーターのみなさんは、今年のマリノス戦を思い出しながら、ニヤニヤしていただければと思います。

得点ランキング

スクリーンショット 2020-12-25 19.59.22

得点ランキングは、上位に2人の大卒ルーキー選手が入ってきました。まずは、川崎Fの三笘選手、今年はMVP取るかと思ってました。来年も要注意選手ですね。そして、鹿島の上田選手、日産でのゴール綺麗すぎて惚れました。来年も要注意。今年は大卒のストライカーに結構やられていたんですね。

余談ですが、上田選手のプレーでYouTubeに上がっていた下記の動画が印象に残っています。これからすごくブレークしそうな予感が漂っている動画でした。これからの活躍を期待してます。

アシストランキング

スクリーンショット 2020-12-25 19.59.28

(背番号が空欄の箇所は、該当する選手がいないことを表しています。空欄の数も数えて表示させてしまいました。。。)

アシストランキングのトップは、C大阪の坂元選手が入ってます。ティーラトン選手が苦しめられた印象が残っています。キレキレの切り返し、見てて楽しいですね。C大阪になかなか勝てないマリノス、坂元選手には来年も要注意です。坂元選手に続いて、広島の浅野選手、横浜FCの手塚選手は入りました。坂元選手、浅野選手は足が速い系ですね。手塚選手はCKから2本アシストを記録していました。

余談ですが、手塚選手はレイソル時代のチャントが好きでした。エレガントなんですね。

準アシストランキング

スクリーンショット 2020-12-26 11.54.21

(背番号が空欄の箇所は、該当する選手がいないことを表しています。空欄の数も数えて表示させてしまいました。。。)

準アシストランキングは、C大阪の選手の3人が上位に出てきました。サイドバックの松田選手と片山選手、ボランチの藤田選手ですね。C大阪になかなか勝てないマリノスですが、来年度の試合は、坂元選手だけではなく、サイドバックとボランチに要注意してみましょう。

余談ですが、藤田選手はとても良いプレーをする印象が個人的にあります。数年前にポドルスキを見るために神戸の試合を見に行った時に、一番印象に残っていたのがなぜか藤田選手でした。確か下記の試合を見に行ったはずです。(このハイライトを見ても、藤田選手の良いシーンはあまり映ってませんでしたが。。。ハーフナーマイク選手が懐かしかったです。)

得点関与ランキング

スクリーンショット 2020-12-25 20.03.37

(背番号が空欄の箇所は、該当する選手がいないことを表しています。空欄の数も数えて表示させてしまいました。。。)

得点関与ランキングのトップは、川崎Fの三笘選手でした。恐るべし。来年もブレイクしそうですね。海外移籍も近いかもしれませんね。

余談ですが、三笘選手は筑波大学出身ですね。天皇杯での活躍が印象的です。当時の筑波大学は、磐田の中野選手、柏の戸嶋選手、清水の西澤選手、札幌の高嶺選手など、当時の筑波大学には現在Jリーグで活躍している選手が揃ってますね。

6.7 得失点までの時間

ここからは、ランキングではなく、時間にフォーカスします。こちらでは、ボールを奪ってから得点を決めるまでの時間と、ボールを奪われてから失点するまでの時間を確認したいと思います。ここで注意事項ですが、ボールを奪う、または奪った時間に関しては、ハイライト映像に写ってないシーンが多くありました。このような場合は、そのシーンが始まった地点をボールを奪う、または奪った時間としております。そのため、得失点が発生するまでにより長い時間がかかったシーンが含まれることをご了承ください。

得点までの時間

画像23

こちらのグラフは、横軸がボールを奪ってから得点を決めるまでの時間(秒)、縦軸が得点の発生数を表しています。こちらの結果から、ボールを奪ってから得点まで10秒前後かかることが確認できます。また、ハイライト映像からデータセットを作ったため、ハイライトでは確認できない時間もボールを保持している可能性があるため、得点までにより長い時間がかかっている可能性が高いです。この結果から、マリノスは、ボールを回して得点を決めるタイプであることを改めて確認できました。0秒や1秒でゴールを決めているシーンは、おそらくPKによる得点だと思われます。来年は、ショートカウンター攻撃による得点ももう少し見てみたいですね。

失点までの時間

画像24

こちらのグラフは、横軸がボールを奪われてから失点するまでの時間(秒)、縦軸が失点の発生数を表しています。こちらの結果より、奪われてから、5秒以内に失点するシーンが多いことがわかりました。ボールロストランキングでも、DFやボランチの選手がランクインしていたこともあり、後ろでボールをロストし素早く失点してしまう傾向があると思われます。後ろからボールを回すスタイルは、DFやボランチのボールロストとのトレードオフとも捉えることができるので、難しいところですね。来年は、DFやボランチのボールロストを減らせるよう、MFやFWなどがパスコースを作るなどのサポートに期待したいです。

6.8 得失点の時間帯

こちらでは、全試合において、90分の内、どこで得点や失点が発生しやすいか確認します。得失点の発生をグラフでまとめました。

グラフの読み方

こちらで紹介するグラフの読み方が少しややこしいので、開幕戦のG大阪戦(1-2)だけを取り出して、グラフの読み方を紹介したいと思います。

得失点時間帯グラフ説明

こちらのグラフは、縦軸に得点の差を、横軸に試合時間を表しています。得点をすると縦方向に+1され、失点すると縦方向に-1されます。上記の図をみていただくと、得失点が発生すると、斜めの線で得点の差が変化していることが確認できます。

得失点の発生時間

得失点時間帯グラフ

こちらが、全34試合における得点差の表したグラフになります。各試合ごとに色が別れております。このグラフを確認すると、全体的に、得失点が発生している箇所は分散されている印象ですね。ただ、開始10分と終了10分前ほどで予想以上に得失点が生まれていることが確認できました。マリノスの試合は、キックオフ時から最後まで目が離せませんね。また、前半で2点差以上で負けている状況の試合がないことがわかりました。これは良いことですね。また、負けた試合のほとんどが2点差しかないことがわかりました。試合に絶望する機会はほとんどないということですね。

得点の発生時間

得点時間帯グラフ

ここでは、得点だけにフォーカスして、得点の発生時間をグラフ化しました。失点に関するデータを全て取り除いてます。開始10分と終了10分前は、得点が発生する回数が多そうです。このグラフから、得点の発生が比較的少ないのは、30-45min、45-60min、60-75minあたりに見えます。特に、後半開始から5分ほどは得点が生まれてません。ハーフタイムは、お手洗いに行って後半が始まってしまったとしても、得点シーンを逃す可能性は低そうです。

失点の発生時間

失点時間帯グラフ

ここでは、失点だけにフォーカスして、失点の発生時間をグラフ化しました。失点も、開始10分と終了10分前に発生する回数が多そうです。全体的には、失点も発生している箇所は分散されている印象ですね。後半開始5分に注目すると、失点は生まれてますね。マリノスの対戦相手のサポーターは、ハーフタイムのお手洗いはお早めに。

6.9 シーンごとの得失点

こちらでは、どんなシーンで得失点が発生するのか確認します。シーン(Play, FK, CK, PK)ごとの得失点数を紹介します。Playとは、選手がパスを回している状況などのボールが動いており、プレーオンの状況を指しています。

---得点---
PK: 2
FK: 2
CK: 7
Play: 58
---失点---
PK: 4
FK: 3
CK: 6
Play: 46
---------

得点に関しては、通常のPlay時に得点する回数がやはり多いですね。CKからの得点も7点と多い印象でした。PKでの得点が2点だったんですね。それだけ相手を崩してゴールを決められたことを表しているのだと思います。

得点に関しても、通常のPlay時に得点する回数がやはり多いですね。PK、FK、CKに関しては、バランスよく取られてる印象です。来シーズンは、PK回数やCKからの失点あたりを減らすことも期待しておきたいです。

7. まとめ

長文の記事を読んでいただき、ありがとうございました。いかがでしたでしょうか?

マリノスサポーターの皆さんはもちろんのこと、他のJリーグサポーターにも今まで気づいていたようで、気がついてなかったデータが明確になって、来年のマリノスの試合をみる上での新たな注目ポイントを見つけられたら幸いです。自分自身としては、今回分析した結果を踏まえて、試合での注目ポイントも少しずつ明確になってきたと思っていて、来年度のマリノスのサッカーがどのように変化していくのか今から楽しみです。

今回の苦労した点などをまとめておこうと思います。

- データセットのカラムを決めるのが大変であった
- データ収集が楽しさもあったが、大変であった。(Jリーグでは、おそらくデータスタジアムとかで雇われている人が毎試合でスプリント回数などの記録をつけているはずです。毎試合すごいです。感心しました。また、筑波大の蹴球部の記事に記載していたデータ班の苦労に共感できました。この苦労もあり、天皇杯で結果を残せるわけですね。)
 - https://note.com/ikuman01/n/n64c0e0d666fb
- YouTubeの映像から、誰がパス出したのか、などの把握が大変であった。
- 伝える文章を作るのに、12/9から準備を始めたため、結構時間がかかった。
- Pythonでのコーディングに慣れてないこともあって、特にPandasの動きなどで苦しむシーンが多かった。MultiIndexとか、日本語のカラム名の扱い方など、苦戦して、諦めた部分もありました。。。でも、DataFrameごとのMerge機能などもあり、SQLを使っているかのような感覚でデータをいじれたのは楽しかったです。
- Noteにまとめるのが難しい。表とか使えないみたいですね。

やってみてよかった点をまとめておこうと思います。

- 自分の好きなチームのデータ分析するのが楽しすぎた。こんな簡単ではないと思うが、スポーツ分析の仕事を経験してみたいな...
- 仕事では基盤よりの仕事なので、改めてデータ分析などアプリよりの仕事も面白そうだと感じた。
- 予め取得したいデータを想定しておくと、分析がスムーズにいくことが経験としてわかった。おそらく、闇雲にデータを取得していたら、分析に無意味なデータが出てしまうなど、効率が悪くなっていたと思います。
- ゴールに関連する情報がデータとして可視化されることで、気がついてなかった選手の活躍などを確認できた。
- Pythonは日本語の記事も多く、Googleで調べるだけで、結構勉強になりました。
- Noteで公開しようとした文章を記載しつつ、分析作業を進めると、分析内容などを見返せたりするので、スムーズに作業できた。
- NoteにURLを貼り付けると、いい感じのリンクが作られる。選手のプロフィールリンクを貼ると、選手の顔写真も表示されて、とてもよかった。

自分で分析した内容をNoteで公開することは初めての経験でした。そのため、このような長文の記事がNoteに適しているのか、皆さんの反応を少し見て考えたいと思います。この記事を少しでも、面白いな、と思っていただけたら、『スキ』を押していただけると幸いです。また、他の人にも教えたいと思ってもらえれば、お気軽にSNS等でシェアしていただけると幸いです。

さらに、公開したコードの修正や別チームのデータセットでの分析など、皆さんが改良して使っていただけたら、なお嬉しいです。

わからない点やおかしな点がございましたら、コメント欄に記載していただければ、可能な限り対応させていただこうと思います。

それでは、良いお年を。

この記事が参加している募集

スポーツ観戦記

おうち時間を工夫で楽しく

この記事が気に入ったらサポートをしてみませんか?