"本質"を見極めたい
『ナショナルジオグラフィック』という雑誌があるのは皆さんご存知のことと思う。教育に熱心な家庭では必ず新聞ラックにさしてある、という話も聞いたことがあるけれども、これは欧米での話だったか。
本誌を毎月購読するとけっこうな出費となってしまうので貧乏書生にはちとハードルが高いのだけれども、ネットで読める範囲は勉強のためにちょこちょこ読むようにしている。最新の話題がメジャーマイナーの別を問わず掲載され、きれいな写真も見られるのでたいへん面白い。
まあその"らしさ"が発揮されたものってわけではないが、次の記事が目に留まった。
筆者は誌上で睡眠に関する連載を持っている医学博士で、(当然ながら)どうも睡眠が専門らしい。
で、今回の記事では、よくネットニュースの見出しに出てくるような「日本人の5人に1人が不眠症」とかいう記述の信ぴょう性について語っている。
「データの代表性確保」と「診断精度」とがトレードオフの関係にあり、つまりどちらかを高めればもう一方が低くなってしまうため、科学的に信頼のおける統計を示すことはなかなか難しい、という内容は実に興味深い。
また、データの採りかた(サンプルの数や定義など)によって表面的な数字が大きく変わるという点も面白く、数字のマジックというのはやはり注意していかなければと思ったことだった。
ちょっと話は変わるが、疑似相関という言葉がある。
数字の上では相関が認められ、2者の間に因果関係がありそうな風に見えるが、実際には2つに共通した別の因子が影響しているだけで、直接的に影響しあっているものではない、という話だ。
たとえばよく聞く話として「ピアノを習っている子ほど学力が高い」というものがある。きちんとした論文を見たわけではないが、どうも本当に正の相関は見られるらしい。
しかし、これはおそらくピアノを習わせている家庭が金持ちで教育熱心、もっというと親の学力も高いというパターンが比較的多いためではないかと思われ、ただ子供にピアノを習わせていれば頭が良くなっていくというわけではないだろう。
このあたりの話はヨビノリのたくみさんがわかりやすく解説している。
ちなみに友達の少ない僕は円周率が100桁言えるので、たくみさんの示す負の相関はどうやら正しそうだ。
上のSuspicious Correlations(怪しい相関)というサイトには興味深い例がいくつも挙げられていて、たとえば「ニコラスケイジが出演した映画の本数」と「プールで溺れた人数」が相関を持っていたりして面白い。
これをそのまんま受け止めてしまうと、「ニコラスケイジが映画に出ると溺れる人が増えるのだから、あいつは芸能活動を辞めるべきだ」という極論をぬかす人が出て来てしまったりする可能性がある。
これはいかにも関連が薄いのでまだ笑い話にもなろうが、先に挙げた動画にもある通り、現実のもっと微妙な例だと意外に人々は間違いを犯すものである。これは疑似相関に限った話でなく、本質的な情報を受け止めることができるかどうかという問題だろう。
目下の事象に近づけると、「夜8時以降のアルコールの提供を禁止」という話を聞いて、「昼間ならいいんだ」とか「酒さえ飲まなきゃいいんだ」とかいうことを考える人が、実は世のなかにけっこういるのである。
よくわからん粒子だか薬品だかを室内にバラまけば空気が消毒できると思っている向きも多いようだし、未だにビニル手袋をつけっぱなしのレジ店員もいるくらいだし、科学的な正しさを全体に求めるのは酷なことなのかもしれない。
まあ、せめて自分だけはできるだけアホな振る舞いをせずに生きていたいものだと思う。
この記事が気に入ったらサポートをしてみませんか?