見出し画像

ハーフタイムで2桁点差つけられると負けやすくなる?

こんにちは

突然ですが皆さん、バスケの解説の中で「ハーフタイムに入る前に一桁点差に抑えておきたい」といった話を聞いたことはないでしょうか?
自分はちょくちょく聞くのですがふと気になりました。

「二桁点差になると負けやすいのか?」と。

ということで上記の話題について検証してみようと思います!

目的

まずは分析のゴールを設定する必要があります。
単純に考えると、二桁点差になると負けやすくなるのかを検証すれば良さそうです。

しかし、ここは解説の言いたい内容を深く解釈する必要があります。

というのも、二桁点差になると負けやすくなるというのが、単純に点差がつくから負けやすくなるというのと区別がつかないからです。
例えば、9点差の時と10点差のときで後者の方が勝率が低いから上記の説が立証された!と主張しても、5点差の時と6点差の時に同じ傾向があったらどうでしょう?
二桁点差にしたくないという言葉の意味合いとは少し変わってきてしまうのではないでしょうか?

そう、ここで見るべきなのは、二桁点差になるとより負けやすくなるのかということなんです!

ということで、今回の分析のゴールは

二桁点差になると、一桁点差の時よりもより負けやすくなるのかを検証する

にします!

分析対象

B1・B2の2016~2019シーズンのレギュラーシーズン・チャンピオンシップ・プレイオフを対象にしています*1。
ハーフタイムで同点のケースを除き、試合数は3936件になっています。

分析・考察

それでは具体的に分析していきましょう。

まずは基本的な情報を確認するために、ハーフタイムでのビハインド点数ごとの勝率を見てみます。

画像1

当たり前の内容ですが、ハーフタイムでのビハインド点数が大きくなるほど最終的な勝率が下がっていることが分かります。
(大体1点ビハインドするごとに3%~7%くらい勝率が下がる感じでしょうか)
気になる二桁点差近辺の動きですが、一桁点差での下がりとあまり変わらないように見えますね。
(下がっていることは間違いない(12点差の部分除く)けど、その下がり方は他の点差の時と同じ推移っぽい)

ここで二桁点差になるとより負けやすくなるとは言えないとしてもよいのですが、せっかくなのでもう少し統計的な検証もしてみます。

具体的な検証方法ですが、今回は下記のようなアプローチでやってみます *2
(前提としてハーフタイムで10点差のついた試合は184試合あり、そのうちビハインドしていたチームが勝ったのは29試合です。)

・点差が1~9点のときの勝率を元に、10点差のときの勝つ確率を予測する
・その確率からすると、184試合行うとyy%の確率で勝数がzz回以下になる
・実際の勝数は29回でzz回より多いので、2桁点差になると有意に勝率が下がるとは言えない or zz回より少ないので、有意に勝率が下がると言える

要は、10点差のときの勝数が、1~9点差の勝率推移から予測される10点差のときの勝数より極端に少なければ、二桁点差でより負けやすくなると言えるのでは?という考え方です。
逆に言えば、極端に少なくなければ、1~9点差の勝率推移と同じトレンドとして一旦は考えていいんじゃないかという考え方です。

それでは実際の結果を見ていきましょう!
(なお、上記のyy%については10%で指定します。ケースによりますがこのような統計分析を行う際の水準としては緩めです)

まず、10点差のとき勝つ確率ですが、予測値は約18.2%となりました。
(以下、算出方法について記載します。興味のない方は飛ばしていただければと)
今回は目的変数にハーフタイムで負けていたチームの最終勝ち/負けの2値変数、説明変数にハーフタイム時のビハインド点数を用いてベイズロジスティック回帰を行いました(行は試合ごと)
ベイズを使った理由に深い意味はなく、ちょっと試してみたかったからだけです。
コードの一部は下記に記載しており、全体のコードはページ下部にGithubリンクを載せています。興味のある方はご覧ください。

glm_under_9pts <- brm(
 win_flag ~ half_time_pts_diff
 ,family = bernoulli()
 ,data = df_under_9pts_behind
 ,seed = 1031
 ,prior = c(set_prior("", class = "Intercept"))
)
# predict over 10pts
diff_data <- data.frame(half_time_pts_diff = seq(10, 20,1))
linear_fit <- fitted(glm_under_9pts, diff_data, scale = "linear")[,1]
fit <- 1 / (1 + exp(-linear_fit))
fit[1]

さて、勝つ確率が18.2%となりましたが、その時に184試合行ったと考えましょう。
そうすると実際に勝つ数はばらつくことになります。無難に184 × 18.2% ≒ 33試合勝つ場合もあれば、もしかしたら20試合しか勝てない場合もあります。
ただ、ばらつくのは確かですが、aa回勝つ確率は算出できます*3。その情報を使って、「yy%の確率で勝数がzz以下になる」の数字を埋めてみましょう。
yyは10%で置いているのでこの数字と、勝つ確率18.2%及び184試合行うという情報を元にするとzzは27となります。
つまり、数字を埋めてみると

10%の確率で勝数が27試合以下になるが、実際の勝数は29試合である。
よって10点差のときの勝数が、1~9点差の勝率推移から予測される10点差のときの勝数より極端に少ないとは言えない

という形になります。

つまり、少なくとも今のデータでは二桁点差の時により負けやすくなるとは言い切れないということになります。

まとめ

ということで、ここまで見てきました。
結論としては、「二桁点差の時により負けやすくなるとは言い切れない」となりましたが、だからといって二桁点差にしてよいというわけでもありません(点差がつけばそれだけ逆転が難しくなるのは確かなので)。

なので言うべき内容としては、「ハーフタイムに入る時に点差は詰めておけると良いけど、二桁点差になったからって特段気にする必要はない」なのかなと思います。当たり前といえば当たり前の結論だな。

ただ、今回のような巷でよく言われる説を検証するのは興味深いですし面白いので、他にも色々やっていきたいですね。

最後に、おまけとしてハーフタイムの点差と最終的な得点差の分布をお見せします。

画像2

丸の大きさは該当する試合の数です。
最終的な点差がプラスの場合は勝利していることになります。

ハーフタイムでのビハインド点差が大きいほど、最終的な点差も右肩下がりになって、仮に勝っても僅差になりがちなのが分かると思います。
これも当たり前の結論ではありますが、実際に可視化してみると分かりやすくなって面白いですね。

ちなみに、ハーフタイムで12点差つけられたけど、最終的に29点差つけて勝った試合がありました(左上あたり)

41点巻き返したのは記録としては最大だったのでどんな試合なのか調べたところ、下記の試合でした。
3Qと4Qの得点が恐ろしいことになっています。アルバルク東京怖い。

ということで今回は以上です。
ご質問・ご指摘などありましたらコメントいただければと思います。
(敬称略)


投稿主のTwitterアカウント

今回のデータやコードの格納場所


*1 
NBAのデータも利用したかったのですが、Qごとの点数を取得するのが面倒くさそうだったので今回は飛ばしています。

*2
この分析で妥当なのかについて自信があまりないので、有識者の方などにコメントいただきたいなと思っています。

*3 
詳しい内容は「二項分布」などでお調べください

この記事が参加している募集

Bリーグ

サポートしていただけるとありがたいですが、 SNS等で広めていただけるともっとありがたいです。 一緒にバスケを盛り上げていきましょう!