見出し画像

お相撲の不連続な分布のおはなし

 最近休みの日に特にすることもなく、仕事も大して面白くないのでnoteを書くことにしました。
今回は修論等でデータを集めまくっていた大相撲の興味深い話でも書いてみようかなと思います。
では、さっそく力士の白星についてお話ししましょう。

超簡単なルール説明

 大相撲という競技を知らない人はいないと思いますが簡単にルールを紹介しましょう。
大相撲は年に6場所あり、各場所15日間取組を行います。力士は1日に一回相撲協会の方で設定された対戦相手と戦うわけです。

力士には昇進というものがあり、15日のうち8勝すると白星の方が多くなり次の場所で、「白星ー黒星」の数だけ上に昇進するとおおよそ言われています。

1.不連続な分布を見てみよう!

では、ここで質問です。今回のテーマは「不連続」ですが、何のデータが不連続になると思いますか。

答えは(すぐ回答ですが笑)、1場所における力士の勝利数の分布です。それを示したのが下のヒストグラムになります。お気づきの点はあるでしょうか。

そうです、
8勝の力士=ぎりぎりで勝ち越した力士が多すぎるのです。

理論的には、1つの取組で勝利する確率はコイントスのように5割であるため、白星の分布は下図の曲線のように二項分布を描くはずです。この時、7勝する人数と8勝する人数が理論的には等しくなります。

しかし現実には、7勝の人数が理論的な人数よりも少なく、8勝の人数が理論的な人数よりも多いのです。

幕内・十両ヒストグラム

2.なぜ不連続になるのか。

 このような歪な分布になる原因、すなわち理論的な値に収束しない原因として、相撲独自の昇進制度があげられます。 
 前述の通り、大相撲という労働市場で昇進するためには15日を必ず勝ち越さなければなりません。つまり、十両力士以上における8勝以上が必須です。そしてどのような形であれ、黒星の方が多くなると降格するのです。(周囲の力士の成績にもよるので必ず昇進・降格するというわけではありません。)
では、なんとしても勝ち越したい力士は、どのような手段で8勝を確実に達成しようとするのかについて考えてみましょう。

1つ目の理由として考えられるのは、

「勝ち越しが懸かった取組で本気を出す」

からです。
例えば千秋楽を7勝7敗で迎えた降格ギリギリの力士は、千秋楽で追いつめられることで今までの取組よりもガチンコで挑み、勝率を上げている可能性があります。この場合、最終日のみ勝率が高くなり、8勝で場所を終える力士が多くなります。

2つ目の理由として考えられるものは、

「八百長をする」

からです。
例えば、勝ち越しが懸かった取組に臨む力士Aの相手が、すでに負け越しが決まっているような力士Bだった場合、その取組における1勝の価値(限界効用)がAとBで異なるため、”どうしても勝ちたいA”と”勝たなくてもいいB”の間で星の売買を行うインセンティブが働きます。そうすると、Aの勝率は100%に近くなるため、分布にゆがみが生じます。

ちなみに、ここでの「売買」には金銭だけでなく、星の交換(「ギリギリの時に負けてあげるので、次の対戦の時は勝たせてね」的な星取引)も含まれます。『ヤバい経済学』の著者レヴィットの有名な論文では、実際に星取引が行われていた可能性が指摘されています。

3.八百長事件前後で比べてみよう

大相撲では、2011年に八百長に関するメールが摘発された事件がありました。記憶に新しい人も多いかと思います。
この事件では、実際に何人かの力士が、降格しないために金銭や星交換による八百長を行っていた事実が明らかになりました。

これを機に相撲協会は不正の防止の徹底を行い、2011年以降は八百長を行いにくい環境になったと考えられます。したがって、2011年以前と以降で8勝に集中する力士の割合に差が出そうな予感がしますね!では、比較してみましょう。

こちらが「2011年以前」の分布です。

Inked幕内・十両ヒストグラム2011年以前 懸賞金データから_LI

そして以下が「2011年以降」の分布です。

Inked幕内・十両ヒストグラム2011年以降 懸賞金データから_LI

2つのグラフの赤枠で囲った箇所を見比べてみると、7勝と8勝の力士の割合の差が、2011年以降の方が小さくなっていることがわかります。つまり、2011年以前は八百長が多く行われていた可能性を示唆しています。
そして、2011年以降でも8勝力士が多いのは、やはり千秋楽周辺で本気を出す力士が多いということを示唆していると考えられます。歪みのすべてが八百長というわけではもちろんありません。
したがって、前後での7勝と8勝の割合の差が、八百長を行っていた割合である可能性が高いと考えられます。

4.まとめ。

今回は、大相撲についての不連続な分布の話をしました。不連続なものは、人間の恣意的なデータの操作が垣間見えるため僕は非常に面白いと感じています。みなさんもぜひ身の回りの不連続を探してみてください。そして何かありそうだったら教えてください笑。

参考文献

Duggan, M., & Levitt, S. D. (2002). Winning isn’t everything: Corruption in sumo wrestling. American Economic Review, 92(5), 1594–1605.

この記事が気に入ったらサポートをしてみませんか?