【Jリーグ】天候と試合結果の関係

初めてのnote投稿です。統計解析の仮説検定の備忘として、Jリーグの試合結果と天候との関係について調べたので書いていきます。


Key Takeaways

あまり、というか全然おもしろくない結果になりますが、清水エスパルスの「晴のち曇」の天候における勝率は、「70%」とかなりの確率で勝利を収めている一方、「晴れ」の天候における勝率は「43.65%」とあまり勝てていない。エスパルスは晴天より少し曇っていたほうが強い!

分析

以下、分析方法について書いていきます。

データはJリーグデータサイトより取得しました。分析対象は1993年~現在までのJ1での成績です。

各天候における勝率を統計的に把握するため、以下の仮説検証をそれぞれの天候について行いました。「それぞれの勝率がある条件の元で50%より大きいか小さいか」を基準として使いました。これは、例えば雨の試合が1試合しかない場合にあるチームが「勝利」した場合、そのチームは雨に強い!というミスリーディングを避けるためです。

仮説検定

以下、エスパルスの晴れの日の勝率(43.65%)を例にした仮説検定です。

・H0:pi = 50% (or 勝率≧50%)

・Ha:pi < 50% 

今回は勝率が50%より低いので、帰無仮説H0は「勝率が50%以上である」としています。以下の解析によって帰無仮説を棄却できれば「勝率43.63%は統計的に50%より小さい」と言うことができます。

・勝率 = 43.65% (晴れの日の勝率)

・α = 0.05

・n = 378試合

sigma = sqrt((pi.*(1-pi.))/n)

・sigma = 0.0257

Zabs = (勝率−pi)/sigma

Zabs = -2.47

Prob-value = Pr{ Z ≦ -2.47} = NORM.S.DIST(-2.47, true) = 0.00678 < 0.05

この結果よりH0を棄却します。この結果より「清水エスパルスの晴れの日の勝率は50%以下である」と統計的に言うことができました。ちなみにその他の天気においては、勝率という観点において有意な差は見られませんでした。

勝率TOP 5

勝率BOTTOM 5



感想/まとめ

今回の分析ではあくまで各天候における勝率が50%を超える(下回る)かどうかを統計的に調べてみました。残念ながら今回行った分析から、「晴れ」の天候だからエスパルスは勝率が高い!ということは簡単に言うことはできません。何故なら今回は天候のみにフォーカスし、その他の要素を無視して考えているからです。あくまで相関はあるが、因果を述べるには分析不足という感じす。

あと、各チームの勝率を正規化する必要があったかなぁと分析を進めながら感じました。優勝争いの常連チームとJ2と行き来しているチームの勝率ではそもそもの絶対値が異なるのであまり値としての勝率をみる意味はないかなと。

Jリーグデータベースから各種データを取得できることがわかったので、暇があればこのような感じの分析をやっていきたいと思います。




この記事が気に入ったらサポートをしてみませんか?