![見出し画像](https://assets.st-note.com/production/uploads/images/108495707/rectangle_large_type_2_97232f843a2f34eedcd7c0eed04cb863.png?width=800)
ハーフタイムで2桁点差つけられると負けやすくなる?~NBA版~
こんにちは
以前にこんな記事を書きました。
バスケの解説の中で「ハーフタイムに入る前に1桁点差に抑えておきたい」といった話をちょくちょく聞くが、それは本当なのかというテーマの分析です。
結論としては、「2桁点差になると1桁点差の時よりもより負けやすくなるとは言い切れない」でした
しかし、この時はB.LEAGUEのデータを利用していましたが、NBAではもしかしたら違うかもしれません。
そこで、今回はNBAでは2桁点差になると1桁点差の時よりもより負けやすくなるのかについて分析をしてみます。
分析で検証したいこと
まずは、改めて「1桁点差に抑えておきたい」 = 「2桁点差にはしたくない」の意味合いを確認しましょう。
(前回の記事とほぼ同じ内容なので、覚えている方は飛ばしていただいて問題ありません)
単純に考えると、2桁点差になると負けやすくなるから1桁に抑えたいということですが、これでは2桁になると負けやすくなることと、単純に点差がつくから負けやすくなることの区別がつきません。
例えば、9点差の時と10点差のときで後者の方が勝率が低いから上記の説が立証された!と主張しても、5点差の時と6点差の時に同じ傾向があったらどうでしょう?
1桁点差にしたくないという言葉の意味合いとは少し変わってきてしまうのではないでしょうか?
つまり、ここで見るべきなのは、2桁点差になるとより負けやすくなるのかということになります
ということで、今回の分析のゴールは
2桁点差になると、1桁点差の時よりもより負けやすくなるのかを検証する
となります
分析対象
NBAの2020~2023の計4シーズンの4800試合
※今回の分析に利用したコードはこちらのGithubリンクに格納しています。
分析・考察
単純集計
それでは具体的に分析していきましょう。
まずは基本的な情報を確認するために、ハーフタイムでのビハインド点数ごとの勝率を見てみます。
![](https://assets.st-note.com/img/1687007076806-8gQOUiFXtp.png?width=800)
横軸がハーフタイム時点でのビハインド点数で、縦軸が最終的な勝率です。
例として、ハーフタイム時点で5点負けている場合は最終的な勝率が30%強となっています。
当たり前の内容ですが、全体の傾向としてハーフタイムでのビハインド点数が大きくなるほど最終的な勝率が下がっていることが分かります。
しかし、3点差→4点差や5点差→6点差の箇所など、点差が広がってるけど勝率が高くなっている箇所も散見されます。
下記はB.LEAGUE版のグラフですが、NBAと比べると勝率が綺麗に下がっている傾向が見えます。
![](https://assets.st-note.com/img/1687007323213-Slqo6XY9Rc.png?width=800)
各点差ごとの試合数の兼ね合いなどあるかもですが、それにしても少し興味深い違いと言えそうです(ここでは深掘りはしません)
そして、肝心の10点差近辺の推移ですが、10点差になったからといって下落傾向が強まってはおらず、9点差までと同程度の落ち方に見えます。
念の為に3Q終了時点の点差と最終的な勝率のグラフも見てみましょう。
![](https://assets.st-note.com/img/1687007484424-hQ9zpEEk6R.png?width=800)
勝率の落ち方はハーフタイムより大きい傾向ですが、2桁点差だから負けやすいということはなさそうです。
ここまでを踏まえると、単純集計では2桁点差になると負けやすくなるとは言い切れなさそうです。
統計的分析
せっかくなので統計的なアプローチでの検証もしてみましょう。
前回は、下記の流れで検証をしてみました。
・点差が1~9点のときの勝率を元に、10点差のときの勝つ確率を予測する
・その確率からすると、184試合行うとyy%の確率で勝数がzz回以下になる
・実際の勝数は29回でzz回より多いので、2桁点差になると有意に勝率が下がるとは言えない or zz回より少ないので、有意に勝率が下がると言える
要は、10点差のときの勝数が、1~9点差の勝率推移から予測される10点差のときの勝数より極端に少なければ、二桁点差でより負けやすくなると言えるのでは?という考え方です。
ですが、同じことをやっても自分が面白くないので今回は別の方法で検証をしてみます。
具体的にはロジスティック回帰とRDD (Regression Discontinuity Design)の2手法で検証してみます
(手法の詳細な説明などが入るので、興味のない方は飛ばしていただいて問題ありません)
まずはロジスティック回帰で見てみましょう。
今回は下記のような回帰式を設定しました
$${logit(勝ちフラグ) = a + b*(Q終了時の得点差) + c*(2桁点差フラグ)}$$
$${b*(Q終了時の得点差)}$$で点差が広がることで勝率が下がることを表現しつつ、それを踏まえても2桁点差が有意に影響を及ぼすのかを検証してみるアプローチです(元ネタはTwitterでいただきました。*1参照)
分析時の各種詳細条件は下記の通りです。
・10点差から大きく離れた点差のデータを採用すると、ガベージタイムなど別の要因の影響が想定されるため、5点差から15点差の間だった試合のデータを採用する。
(10点~15点差だった場合は2桁点差ダミーに1が振られる)。
・有意水準は5%で設定する。後述のRDDも同様。
結果は下記のようになりました。
![](https://assets.st-note.com/img/1687008451288-zHxZOAD57I.png?width=800)
pts_diff_tqがハーフタイム時点での点差で、two_digits_flagが2桁点差フラグです。
Pr(>|z|)を見るとハーフタイム時点での点差は最終的な勝敗に有意に影響していますが、2桁点差フラグは有意差がありませんでした。
この結果を踏まえると、やはりハーフタイム時点で2桁点差になることの影響は見受けられないと言えます
RDDでも見てみましょう。
この手法ではいくつかの前提を満たす必要がありますが(参考リンク)、今回のケースでは満たされていると考えられるため、RDDを適用して考えてみます。
※勝敗フラグを目的変数として分析することができなかったため、この分析でのみ、最終的な点差に影響があったかを分析対象としています。もし最終的な点差に影響があるとしたら、それは勝敗にも影響しているだろうというロジックです。
結果は下記のようになりました。
![](https://assets.st-note.com/img/1687009043424-941WOMNQ5t.png?width=800)
LATEのPr(>|z|)の数値0.2697を踏まえると、RDDでも2桁点差には有意な影響が見受けられませんでした。
これまでの結果を踏まえ、ロジスティック回帰やRDDでも2桁点差が有意に影響しているとは言えないという結論になりました。
まとめ
やっぱりNBAでも2桁点差特有の影響はなさそう
投稿主のTwitterアカウントです。
バスケに関する分析を投稿しているので、是非フォローしていただければと。
*1 下記で案をいただきました。ありがとうございます。
バスケの勝敗yを
— Hiroki Uchide (@hanon52_) March 31, 2023
logit(y)=a+bX+c(10点差以上ダミー)
でモデリングして、cが有意になるか、を見るのもよさそう。
Xは適当な共変量。
勝率に与える影響がこんな単純な線形の式で表せるとは思わないので、そこはいい感じに調整が必要。 https://t.co/6DkByvDYAo
サポートしていただけるとありがたいですが、 SNS等で広めていただけるともっとありがたいです。 一緒にバスケを盛り上げていきましょう!