選手名鑑を読まずに予測したEURO2020を振り返る(ベスト16編)
↓の記事のアンサー記事,第2弾です.
グループステージ編はこちら↓
というわけで,EURO2020のベスト16(R16)が終わりました.総括すると「かなり予測に近い,順当な結果だった」ですね.え?どこが順当だったのかって?という質問にもお答えします.
予測は以下のサイトで公開中です.
R16最大の番狂わせは?
R16の8試合の予測と結果を示します.
上位チームの予測勝率の合計は6.06なので,2試合程度番狂わせが起きそう,という事前の評価でした.番狂わせ率が高いほうから並べるとウクライナ対スウェーデン(0.4590),スイス対フランス(0.3467)と続いており,実際にこれらの2試合で番狂わせが起きました.ただしウクライナの予測勝率は0.5にかなり近く,「番狂わせ」といえる程度に実力差がある残り7試合のうち最も置きそうだったのがスイス対フランス戦でした.実際にフランスは敗退(記録上は引き分け)だったので,かなり「順当」であったことがわかります.
驚くべきだったのはチェコの勝利(予測勝率0.1592)で,こちらが真の番狂わせと言えるでしょう.
結果として予測との逆転が起きたのは実力伯仲の1試合と,本当に番狂わせといえる2試合で,予測が実際の結果にかなり近かったことがわかります.
「順当」は「予測確率が高いほうから全部が勝ちぬけた」ではなく,「予測確率(の合計)と結果が近かった」ことを意味します.ですので,ある程度の番狂わせが予測された量起こることが「順当」です.「予測確率が高いほうから全部が勝ちぬけた」は予測正解数・率の観点では良いように見えるのですが,「予測勝率が小さすぎた=上位チームの実力を過小評価していた」ことであり,予測が適切であるとは言えません.
「番狂わせが何試合くらいおきますよ.その確率はこれくらいですよ」というのが定量的予測として適切な態度です.
QF進出予測と結果の比較
大会前のQF(準々決勝=ベスト8)進出予測と結果を比べてみます.
"toQF_cum"列はQF(準々決勝=ベスト8)に進出する確率を低い順から合計した値,"QF"列は実際の進出チームです.「合計確率1.0までのチームから1チーム」「合計確率2.0までのチームから2チーム」…となると予測と結果が近い,と解釈できます.図にするとこんな感じ.
予測は青破線,結果が赤実線です.青と赤の線の差が小さく,予測が結果をうまく説明できていることがわかります.2標本コルモゴロフースミルノフ検定では「有意差なし」で,予測と結果が異なる分布であるとは言えない,ということもわかります.
QF展望
QF4試合の予測勝率です.
上位チームの予測勝率合計は3.09で1試合番狂わせが起こるだろう,という予測です.そして最も接戦なのがベルギー対イタリアという予測です.