見出し画像

【99%無料】データに騙され、損する人へ。


”読む前に、まずは「いいね」を押すのが筆者に対する礼儀だーーー。”(1996,いしかわ)


このnoteは最後の1文のみ有料コンテンツですが、タイトルの内容は最後まで確認できます。


東大生の50%はピアノを習っていた。

このような広告を見たとき、あなたは何を思うでしょうか?短絡的に「子供にはピアノを習わせなきゃ!」と思ってしまう方は、もしかするとデータに騙されやすい性格かもしれません……。


”相関関係”と”因果関係”

上のような考え方が危険な理由を説明するには、相関関係(そうかんかんけい)と因果関係(いんがかんけい)という言葉を正しく理解する必要があります。

相関関係
一方が変化すれば他方も変化するような関係。


東大生とピアノの例で説明します。2019年、ピアノ・エレクトーンを習っている人口の割合は20%程度であることを考えると、東大生のピアノ人口50%は非常に特徴的であることがわかると思います。また東大に限らず、学力の高い集団ほどピアノを習っている割合が高いという調査結果も報告されていますから「学力」と「ピアノを習っているパーセンテージ」という2つの数値は相関関係があるということが言えます。(画像はイメージです)


ここからが重要です。ピアノと学力に相関関係があるのは間違いないのですが、因果関係があるとは限らないのです。

因果関係
2つ以上のものごとの間にある、原因と結果の関係。


「東大生の習い事にピアノの割合が高い」というのは紛れもない事実ですが、果たしてこれらに因果関係はあるでしょうか?言い換えると、学力が向上した原因はピアノなのかということです。冷静に考えて「ピアノを弾くと頭がよくなる」なんて、そんな馬鹿な話があるわけないでしょう。(主観)


ピアノと学力の真実

とはいえ、ピアノには前頭葉の機能を高めたり、集中力を増加させる効能があることを示す研究もあるようです。ここからピアノと学力を結び付けるのは飛躍が過ぎるような気もしますが、とりあえず文句を言いたい気持ちを抑えて因果関係があると仮定しましょう。

【因果関係がある場合】
・ピアノは前頭葉の機能と集中力を圧倒的に高めるので、結果として子供の学力が向上し、東大合格率も上がる。

私としては全く納得がいきませんが、これが事実の可能性もあります。一方で、実際の因果関係が薄いにもかかわらず、関係があるかのように見せかけるデータの見せ方には、疑似相関(ぎじそうかん)という名前が付けられています。

疑似相関
2つのものごとに因果関係がないのに、見えない要因によって因果関係があるかのようにみせかけること。(見えない要因のことを交絡因子(こうらくいんし)という)


いったいなぜ東大生にはピアノ経験者が多いのか、そこに最も大きな影響を与える交絡因子は親の収入だと私は考えます。

ピアノを習うにはもちろんお金がかかります。調べによると相場は5000円~10000円程度。また、ピアノのプロに育てようということでもなければ、一般的にピアノの優先順位は学校の勉強の下に来るでしょう。つまりピアノにお金をかけられるような家庭は、学校の学習においてもお金をかけたり環境を整えたりできる割合が高いのではないかといったことが予想されます。

以上のことから「東大生の2人に1人がピアノを習っていた」という売り文句は、親の年収という見えない要因によって因果関係があるように見せかけられた一種の疑似相関の可能性があるということが言えます。

【疑似相関の場合】
・ピアノを習わせることができる家庭は世帯年収が高い。よって教育にもお金をかけられるため、結果として子供の学力も向上し、東大合格率も上がる。

私はこちらが真実のような気がしますが、あなたはどう思うでしょうか。


”親の年収と学力”も疑似相関では?

賢い方はもうお気づきでしょうが、親の年収と学力というデータに関しても、因果関係がある場合と疑似相関である場合の2つが考えられます。

【因果関係がある場合】
・親の年収が高いので、教育にかける費用も多くなり、結果として子供の成績が向上する。(年収が高いことが原因で、子供の成績が高いという結果がある)
【疑似相関の場合】
・親の年収が高いほど教育に対する意識も高く、子供の面倒をよく見る可能性がある。また、年収が高いゆえに読書習慣が身についており、子供が家にある本を日ごろから手にしていた可能性もある。(太字が交絡因子。この場合は教育意識読書習慣が成績に因果関係を与えているため、年収と学力の関係は疑似相関となる。つまり、年収が低くても教育意識と読書習慣が高水準であれば成績は高くなる。)


世の中の広告やニュースは疑似相関だらけ

”疑似相関が悪”のような書き方に見えたかもしれませんが、そうは言っていません。なぜなら、疑似相関は嘘ではないからです。「東大生の2人に1人がピアノを習っていた」というデータは嘘でも誤りでもありません。掛け値なし100%、真実のみから構成されたデータです。ここから「ピアノは教育にいい!」と早合点をしてしまうのはいつだって我々消費者。もちろん広告を打つ側は、この早合点を狙っているのですが…。


データの関係性を正しく見抜く力を鍛えなければ、人生において大きな損をしてしまいます。ということで、以下にネットや書籍からかき集めてきた疑似相関を一挙に羅列しましたので、今後の人生に役立てて頂ければと思います。


①原因と結果の逆転

犯罪件数の多い国は刑務所が多い。だから刑務所を減らせば犯罪は減る。

多くの犯罪が起きた結果多くの刑務所ができたので、刑務所を減らしても犯罪は減らない。

車いすは危険だ。なぜなら車いす利用者の多くは事故にあったことがあるからだ。

事故という原因があり車いすという結果があるので、逆は成り立たない。

バレーボール選手は身長が高い!子供にはバレーを習わせましょう!

身長の低かった選手は活躍できず、選手になれなかったということが考えられる。バレーを習ったからと言って身長が伸びると結論付けるのは早計である。


②共通原因がある場合

ビールの売り上げが増加すると、水難事故が増える。だからビールの販売を規制しよう。

ビールの売り上げと水難事故の共通原因は猛暑なので、両者に因果関係はない。

背が高い子供ほど学力が高いので、身長と学力には因果関係がある。

身長と学力は年齢を重ねるごとに増大する傾向にある。両者に因果関係はない。


③当たり前の事実

犯罪者の家からテレビゲームが出てきた。犯罪抑制のため、ゲームを規制しなくてはならない。

テレビゲームの普及率を考えると、ゲームを犯罪の原因に当てはめるのは無理がある。

水は酸性雨の主成分である。よって水は危険な液体だ。

これだけを見ると馬鹿らしいと思うかもしれないが、

防虫剤に使われるジクロルボスは非常に毒性が強く、構成成分であるメチルラジカルには特に気を付けなくてはならない。

これであれば何となく身構えてしまう人も多いのではないだろうか。しかし実際のところ、メチルラジカル(CH3)は寿命が1000分の6秒しかない。そもそも安定状態で存在できないため、気をつける必要すらない物質だ。ニュースで放射線や特定の団体の恐怖を煽るときによく使われる技法がこれである。


④偶然の一致

有数の長寿国である日本では日常的に漬物が食べられている。よって漬物は健康に良い。

日本が長寿国であることと漬物がよく食べられることはただの偶然なので、両者に因果関係はない。

オランダの統計では、コウノトリの数と赤ん坊の出生率に正の相関が得られた。

当然だが因果関係は存在せず、まったくの偶然である。(気候や文化などが偶然の一致をもたらしているだけ)

ミス・アメリカの年齢と暖房器具の死亡者数

有名な疑似相関。当然これも、偶然の一致である。(原因と結果の経済学)

サバとCD

ここまでくると、"すごい"しか出てこない。


⑤交絡因子・疑似相関

明かりをつけて寝る若者は、目が悪くなる

これはある大学が発表した研究結果だが、別の機関が再度検証し、因果関係は否定された。交絡因子は"親が近視"であり、目の悪い親が部屋の明かりをつけている割合が高いだけだった。つまり目が悪かったのは単に遺伝である。

運動をよくする人ほど肺がんになりにくい

交絡因子は喫煙であり、”運動する人の喫煙率が低いために、肺がんになりにくい”というのが真の因果関係である。

プロ野球は後攻の方が勝率が高いため、野球は後攻のほうが有利である

後攻はホームチームであることが多いため、敵チームに比べて有利な判定が出やすい。よって、後攻の勝率は先攻よりも高まる。つまり交絡因子はホームチームかどうか

隕石が発見された場所には小中学校が多い

小中学校はおおむね人口に比例する。人が少ない場所の隕石は基本的に発見されない。よって交絡因子は人口といえる。



おわりに

今回お伝えしたかった内容はこれで終了です。裏がありそうなデータを見つけたときにこのnoteを思い出し、騙される人が1人でも減るならば、公開した意義があるというものです。我々は提示されたデータをみたとき、"それがどのような思考へ誘導しようとしているか"をよく考えなければなりません。そうしなければ、いとも簡単に騙されてしまうでしょう。


おまけですが、最後に特典として有料部分を用意しています。これは、このnoteを面白いと感じた人に向けたものです。

特典:このnoteを面白いと思った人が好きそうな、WebページのURL

複数の候補があり吟味には時間がかかりましたが、なんとか1つに絞りました。ぜひ楽しんでください。このページから遷移することで2時間は楽しめることを保証します。


最後になりますが、いいねやリツイートなどをしていただけるととても嬉しいです。リンク付きで感想頂けたらリツイートします。


購入される方も、無料部分を読んでくださったかたも、最後まで目を通して下さりありがとうございました。

Twitterのフォローもよろしくお願いします。

※追記

このnoteの反対バージョンとして、「データの悪用方法」を書いた新聞記者の方がいます。併せて読んで欲しいnoteです。



有料部分(URL)はここから↓

(買わない方にはハートマーク押して欲しい😭)


この続きをみるには

この続き: 22文字

【99%無料】データに騙され、損する人へ。

石川航大

250円

この記事が気に入ったら、サポートをしてみませんか?
気軽にクリエイターの支援と、記事のオススメができます!
315
https://twitter.com/73_568 ◆23歳/Twitterで100いいねを獲得するのが趣味◆

こちらでもピックアップされています

UX関連の学び
UX関連の学び
  • 238本

・UX ・データ分析 について先駆者のnoteをストックしていきます。

コメントを投稿するには、 ログイン または 会員登録 をする必要があります。