見出し画像

シンプソンのパラドックス〜個別の実力は勝っていても平均では負ける?〜

 統計の罠を示す面白い数学ネタとして「シンプソンのパラドックス」というものがある。今回はこのパラドックスについて説明しよう。

 A高校の男子はB高校の男子よりも学力が高く、A高校の女子はB高校の女子よりも学力が高いとする。平均的に学力の高い高校はどちらの高校だろうか?

 直感的に考えるとA高校の方が男女ともに上回っているので学力が高いと考えられるだろう。しかし、この全体は間違いだ。状況によってはB高校の方が学力が高いという状態が存在しうるのである。

 例えばこのような状況を考えてみよう

A高校 男子100人・女子100人 男子平均点80点・女子平均点60点
B高校 男子200人・女子50人   男子平均点75点・女子平均点55点

 この場合、A高校の平均点は70点に対し、B高校の平均点は71点になる。なんとB高校の方が学力が高いという計算になるのである。

 どうして直感に反する結果が誕生したのだろうか。それは男女の学力差が大きかったことが原因だ。A高校の女子は確かに賢いが、それでもB高校の男子には敵わない。B高校は学力的に有利な男子の割合が大きかったことによってA高校に勝利したのである。

 シンプソンのパラドックスの例をやや誇張して図示すると以上のようになる。平均値とは「重み付き」の値だ。男子の多い高校の平均点は男子平均点に近くなるし、女子の多い高校の平均点は女子平均点に近くなる。B高校は男子の多い高校だったことが幸いして平均点が高くなったのである。

 実際にこのパラドックスの成り立つ状況は存在するだろうか。 良く具体例として出されるのは外科医だ。X医師は名医として名高く、Y医師はヤブ医者だったとする。その評判を反映してX医師のところには大変難しい患者ばかり来るのに対し、Y医師は医局で干されているので簡単な手術しか任されないとしよう。X医師は難しい手術ばかりやっているので失敗率は高い。Y医師は誰でもできる手術ばかりやっているので失敗率は低い。難しい手術をやっても簡単な手術をやっても圧倒的にX医師の方が圧倒的に腕前がいいのにも関わらず、Y医師の方が成功率が高いという結果が出てしまっている。

 他にも将棋棋士の勝率を挙げることができる。藤井聡太はデビュー当初に29連勝を記録した。デビュー2年目に年間勝率84.9%という卓越した勝率を挙げた。現在の勝率はこれを下回っているし、連勝記録も更新されそうにない。藤井聡太は弱くなってしまったのだろうか?もちろんそんなことはない。単に強い相手と戦う回数が増えただけである。強い相手と戦っても弱い相手と戦っても現在の方が勝率は高いだろうが、強い相手と戦うことが多くなったので、現在の方が勝率が低くなってしまったのである。これは藤井聡太に限ったことではなく、勝率の上位記録はだいたいデビュー当初に記録される。

 先程の例を出したように学力では成り立つだろうか。数学の能力を考えてみると東大理系>京大理系、東大文系>京大文系は明らかである。旧帝国大学の中で東大は文系の割合が大きいから、実は学生の数学力は京大の方が高いことにならないだろうか?しかし、京大の方が理系割合が高いと言っても基本は総合大学であり、シンプソンのパラドックスを成立させるほど大きな差はない。また、東大理系と京大理系の数学力の差は大きく、東大文一ですら数学力は大半の京大理系を上回っている。どうにも「京大生の方が数学できる説」は成り立たないようだ。

 一橋と東工大にも似たような類推が状況が存在しないか考えていたが、東工大に文系の進める学部がないのでこれまた不成立だ。早慶と旧帝に関しても、旧帝文系の方が早慶文系よりも明らかに数学ができるので不成立だ。どうにも日本の学歴社会にはシンプソンのパラドックスに当てはまってくれる大学が見つからない。 

 学校がダメなら経済はどうだろうか。こちらも類する状況をなかなか見つけられなかった。格差の大きい業界と格差の小さい業界を比較すると、格差の大きい業界の勝ち組>格差の小さい業界の勝ち組>格差の小さい業界の負け組>格差の大きい業界の負け組、となり、シンプソンのパラドックスにはならない。意外に学校や会社にこの事例は現れないのか??だからこそパラドックスとして認知されるのかもしれない。

 

 



この記事が気に入ったらサポートをしてみませんか?