見出し画像

【検証】体重が重い力士は有利か?〜データ分析から〜

明けましておめでとうございます。
今年は10本noteを書くことを目標に(たぶん無理)、頑張っていきたいと思います。
今回も大相撲についての記事です。ずいぶん前に見つけた記事をきっかけに、力士の体重と勝敗についてデータを使って分析してみました。

大相撲と体重

大相撲という競技の特徴の一つに、「体重に関係なく対戦が組まれる」というものがあります。ボクシングや柔道などのスポーツは、形式は相撲に似ているものの、体重によって対戦が制限されています。
これは体重によって、あるいは体重に伴う体格の差によって生まれる有利不利を公平にするための措置ともいえるでしょう。

大相撲が体重別になっていないということは、体重別にしなくても不利にならないからなのでしょうか?あるいは、不利であることを誰も気にしていないのでしょうか。

私が大相撲を見る限り、「体重による勝敗差は生まれない」のではないかという仮説を持っています。
というのも白鵬も稀勢の里も巨漢力士ではいないこと、なんとなく近年「大きさ」よりも「技」が重要に見えることによります。

重い力士は有利…?

先日こんな記事を発見しました。タイトルは、

こちらのコラムの論点は以下の通りです。

・体重が重い力士の方が有利
・幕内では、体重差で勝敗は決まらない
・体重1.5倍を超えると、勝率は大きく上がる

今回は、これらを1個1個検証していきましょう。

分析方針

基本的な分析方針は、取組ごとのデータ分析です。
取組ごとのデータを使うメリットとして、体重と勝敗に関係する他の要因までコントロール(一定に)できることが挙げられます。

分析対象は、2005年~2018年の幕内力士と十両力士の取組データ、計82638取組です。

(ちなみに上の西尾氏の分析は、勝利した力士の平均体重と負けた力士の平均体重を比較して比率を出しています。そしてその比率をもって、勝利した力士の方が重いことを示しています。)

検証①:体重が重い力士の方が有利か?

検証①では、体重と勝敗を回帰分析します。回帰分析については、ここでは要因と結果の関係を見るための分析手法の1つとでも考えておいてください。

「相手との体重比率が1%ポイント上がった時に、勝率が何%ポイント上がるのか。上がるとすればそれは偶然ではないか。」、これを分析します。

この分析の意味するところは、

「相手の体重は一定で、自分の体重が例えば10kg増えたら勝率がどれくらい上がるのか?」

こういった分析すると考えてください。

説明変数(要因側)に体重、被説明変数(結果側)にその取組に勝ったかどうかのダミー変数(1 or 0)を入れ、回帰分析を行います。

(少し細かいですが、番付の差や土俵歴の差、身長差等の要因は取り除く処理をしています。)

体重比と勝率(平均)の関係は以下のグラフのようになります。右上がりですねえ。

画像1

具体的な結果が以下の表になります。

画像2

相手に対する体重比の行には、体重比が1%ポイント増加した時の勝率の上り幅を表しています。

要約すると、幕内力士と十両力士を合わせた分析では、「体重が相手より1%ポイント重いと、勝率が0.647%ポイント程度上がる」ということがわかります。
ですので、例えば「相手が100kgで自分が110kg」の時は、「相手が100kgで自分が100kg」の時よりも勝つ確率が6%ポイントくらい勝率が上がることを意味します。

ちなみに、各体重比が勝率に与える影響をグラフ化したのがこちらです。
(縦軸を100倍した%ポイント分影響があります。)

画像3


検証②:幕内では、体重差で勝敗は決まらないのか?

検証②では、幕内力士について①と同じ分析をしますが、もう上でやってしまいましたね。
(2)列を見ると、幕内力士も体重が重い方が有利になっています。体重が1%ポイント重いと、勝率が0.8%ポイント上がるようです。

これを見る限り、十両力士は0.3%程度しか勝率が上がらないのに対して、幕内力士は0.5%ポイントも勝率が高くなるのはなぜでしょう。(わからない)

検証③:体重150%を超えると勝率は大きく上がるのか?

最後は、相手より1.5倍以上重いと勝率が大幅にアップするかを検証します。
ここでは、経済学の実証分析でよく使う、RDD(回帰不連続デザイン)を用います。

RDDについて少しだけ説明すると、ある閾値(カットオフ)を超えることによって、超えない時よりもどれくらい結果が異なるかを検証する方法です。
RDDは因果推論の手法として近年注目が集まっている手法です。

ここでは、カットオフを西尾氏のいう150%に設定し、150%の直前と直後を比較し、勝率に大幅なジャンプがあるのかを検証します。

イメージとしては、

150%ラインを境に、勝率が大幅に上がっていれば150%仮説は成立する

と考えてください。

分析結果のグラフを下に貼っています。

画像4

このグラフから、150%を超えることによる勝率の大幅な増加はないことがわかります。
ちなみにちょっと差があるように見えますが、検定すると有意ではありませんでした。
(150%前後で取組の性質が似ている必要があるため、直前直後のみ回帰直線を引いています。)

したがって、検証3の仮説は否定されました。

まとめ

今回は、ネットで見かけた記事をきっかけに体重と勝敗について分析を行いました。
最近ちっこい幕内力士も出てきたので、そんなに体重は勝敗と関係ないと思ってましたが、思わぬ結果です。

次回に向けていろいろ考えていますが、今年一本目にしてネタ切れ気味なのでだれか面白いネタをください。
また次回をお楽しみに。

この記事が気に入ったらサポートをしてみませんか?