見出し画像

2021年J1リーグ降格ボーダーライン予測:残留確率95%の勝点は??(と,2020年の公開物の宣伝)

*この記事は「スポーツアナリティクス Advent Calendar 2020」20日目の記事です.

2021年のJ1リーグ:20クラブ

「降格無し・昇格あり」を決断した2020年のJリーグ.その結果,2021年のJ1は20クラブで構成されることとなりました.それと同時に「2022年J1は18クラブ」も決定.その結果,「2021年のJ1は20クラブ.4クラブ自動降格」となりました.


降格ボーダーライン予測

J1が20クラブになるのは史上初.ということで,これまでの降格ボーダーラインの知識をアップデートしなくてはなりません.そこで,以下の方法を試してみました.

・試合数に比例して掛け算

・レーティング(定量的実力評価)を利用する.

*Masseyレーティング(得失点差を説明する)

*Eloレーティング[の変種](得失点比を説明する)

予測結果を先に(予測手法は後で)

細かいことはいいんだよ!という方のために予測結果です.

画像1

残留=16位以上となる確率が95%を超える勝点を46と予測しました.また,残留確率が50%となる勝点は38です.

・参考:2005年~2019年の16位の勝点が多いほうから41,39,37.通常のシーズンで残留確率が95%を超えるのは勝点41程度と見積もれます(勝ち点41とっても降格してしまうのは20年に1回程度).

ただし,降格回避の対策による勝点増加の影響(↓のスライド内に詳しく書きました)を考慮すると,さらに+1~2点必要かもしれません.

予測手法の概要

詳細は研究会(第67回(再)「離散事象システム研究会」)で発表したスライドをご参考にしてください.

2021年サッカーJ1リーグ降格ボーダーライン予測 / Prediction of relegation from J1 league in 2021 season

・2005年~2019年の各クラブのレーティングを算出して分布を推定.以下,Eloレーティングに基づく結果のみ示します.

画像3

図1:推定したレーティング分布に基づくシミュレーション(青線,黒破線)と実際の勝ち点(箱ひげ図)

シミュレーションと実際の勝点分布はおおむね近いんですが,1位と13-15位はシミュレーションと実際の分布がずれていそう,という検定結果が得られています.13-15位はシミュレーションよりも実際の勝点が有意に多く,降格回避対策の効果が示唆されます.

・J2からJ1へ昇格したクラブのJ1でのレーティングを推定.

画像4

図2:昇格クラブのレーティング.昇格前(横),昇格後(縦)

図2は昇格クラブ(40/15年間)の昇格前後のレーティングです.横は昇格前なので0.0(J2リーグ平均)より高い0.3前後に集中して分布しています.昇格前後で相関は無くはない(相関係数は0.45程度)ですが,昇格前のレーティングから昇格後のレーティングを推定する分布関数をうまく作れそうにないので,すべての昇格クラブの昇格後の分布(右図)から昇格2クラブのレーティングを生成することとしました.

副産物:昇格後のレーティングが0.0以上(J1平均以上)のクラブは10/40.昇格前の成績(ここではJ2での得失点)だけでは昇格後の成績はそこまで正確に予測できない.

・20クラブのレーティング分布と勝率モデルを作成し,10000シーズンをシミュレーション.

画像2

図3:Eloレーティング(得失点差)に基づく20クラブの勝点分布予測

図3が20クラブでの勝点予測分布です.17位の(平均)+2(標準偏差)=45.02なので,残留(16位以上)となる確率が95%を超える勝点が46と予測されました.また,残留確率がおよそ50%となる勝点は38です.ただし,前述の降格回避対策の効果を考慮するのであれば,さらに1~2点ボーダーが上がることも考えられます.

この結果ですが,過去15年の17位の勝点を単純に38/34倍(試合数の比率)して得られた結果(17位の(平均)+2(標準偏差)=45.27)とほとんど変わらない!という,若干徒労感の残る結果が得られました.(苦笑

来年も楽しくサッカー観戦・スポーツ観戦できるといいですね!

ここからは宣伝を兼ねた活動報告です

2020年にWebでいろいろ活動したまとめです.スポーツ統計関連.

・Jリーグ・特にグランパス関連

グランパスのファンサイト「グラぽ」のライターになんとなく混ぜてもらって2年目でした.今年のcontributionは少なくて2件のみ.ジニ係数をアレンジした「出場時間集中係数(仮)」は自画自賛したいアイデアなので(笑),今年の振り返りとしてどこかでまとめたいです.

もう1本は2021年から6年も閉場する瑞穂陸上競技場に対するお気持ち表明.エモみにパラメータ全振りしてみました.


・バスケットボール関連から一つ.攻守の成否をコート上の10人全員に分配すると,強い選手の組み合わせが抽出できたりするんじゃないか,という提案.数シーズン分データがあって論文にしたいが時間と先行研究調査のやる気が足りない(苦笑

・#spoana 関連

COVID-19の影響で無観客/観客制限となったサッカー界.そんな中でのホームアドバンテージを評価してみました.すぐに論文にする(実際書き始めている)つもりだったけど,時間と(略

・ マルキーニョス・ディスタンス

tkqさん(https://twitter.com/tkq12)のネタツイートを拾ってMATLABに解かせる芸を数回発揮していますが,2020年のヒット作はこれでした.代表作の一つになった感があります.

・UFJC(Unofficial Football Japanese Champion)

こちらもtkqさんのネタを拾って計算機で淡々と解く芸の成果.こっちをアドベントカレンダーにしてもよかった気もしますが,この記事を結構前に書き上げてしまったので別のエントリとしました.

・大相撲レーティング

2月に無事論文として出版されました.学会のカバーする分野とは若干分野違いでしたが,大量のデータ分析という観点で何とか査読してもらい感謝です.2か月に1回,かつ自分がたまにしか大相撲を見ないので更新をよく忘れています.11月場所も忘れていたのでこの下書きを書き始めてから更新しました.

・記名記事とか顔出しとか.

いろいろとご縁がありまして記名記事や顔出しインタビューを世に放ってしまいました.ボリスタに載せてもらった写真は10年近く前なので今日の容姿とは異なる可能性があります.

自分でも忘れてるものがありそうなんですが,記憶力が悪いだけです.そっと教えてもらえるとしっれっと更新します!ではまた!


この記事が気に入ったらサポートをしてみませんか?