マガジンのカバー画像

データの誤謬シリーズ(全15回)

16
” 誤謬(ごびゅう)とは、つまり、間違っていることである。” データにまつわる誤謬を紐解き、やさしく知るシリーズ
運営しているクリエイター

#ビッグデータ

データの誤謬#1『チェリーピッキング』

いけませんよ! おいしいところだけ、つまみ食い。 #1 チェリーピッキング自分の主張に合う結果だけを選択し、そうでない結果を除外すること。 データに不誠実であるという最悪で最も有害な例。 何かを主張するときには裏付けとなるデータが重要になります。 しかし、人々は、全体を説明する代わりに、自分の主張を裏付ける一部の都合の良いデータだけを強調することがよくあります。 これは、公の場での議論や、政治の場でよく見られる現象で、 どちらの側も自分の立場を裏付けるデータを強調するこ

データの誤謬#2『データドレッジング』

サラダにかけるアレではありませんよ。 まあでも似ているので、 水底をサラう、ドレッ「ジ」ングと覚えちゃいましょう! #2 データドレッジング相関関係が実際には”偶然の結果”であったことを認めないこと 何かしらのパターンを見つけようとして繰り返し検証していくうちに、たまたま偶然、統計的に有意な結果が出てきたことに対して、それを信じて疑わないことです。 歴史的に見ても、研究者が結果を「データドレッジング」して、都合の良い結果に結びつけるため、”データの対象”をすり替えてしま

データの誤謬#3『生存者バイアス』

持っていないデータを探すってどういうこと? #3 生存者バイアス 不完全なデータから結論を導き出すこと。 何らかの選択基準を「クリア」したデータだけを見てしまうこと。 例)失敗が無視されるケース。 次の問いについて、考えてみましょう。 Q: 戦闘から戻ってきた飛行機があり、弾痕が確認できます。無事に帰還する飛行機を増やすために、装甲を施したいです。どこに装着したら良いでしょうか? A:弾痕が多いところに装甲を施す。 … は、悪くないようだが、ここに「生存者バイアス

データの誤謬#4 『コブラ効果』

死亡原因はコブラ。 ちょっと恐い話です。(嘘です。) #4 コブラ効果問題解決のためのインセンティブが意図しない負の結果を生むこと。 名前の由来は、イギリスによる植民地時代のインドにおける逸話。 1800年代の大英帝国は、植民地のインドでコブラに噛まれて死亡する人を減らしたいと考えていました。これを減らすために、コブラの皮を1枚持ってくるごとに金銭的なインセンティブ(報酬)を与え、コブラ狩りを奨励しました。 しかし、その代わりに人々はコブラを養殖して稼ぐようになってし

データの誤謬#5 『誤った因果関係』

海賊が減っているのは、地球温暖化のせいだって? そもそも、海賊ってまだいるの? #5 誤った因果関係   2つのイベントが同時に発生したときに、一方が他方を引き起こしたに違いないと誤って想定すること。 過去150年間、「地球の温度」は着実に上昇しており、 「海賊の数」はそれに匹敵する割合で減少しています。 海賊の減少が地球温暖化を引き起こした。とか、 海賊が増えれば地球温暖化が元に戻る。とは、、、考えられませんよね。 いや、もしかしてもしかすると、、、ないですね。

データの誤謬#11 『 シンプソンのパラドックス 』

「平均値」ってよく耳にしますよね。 どうしても、「普通」とか「中央値」という意味で連想しがちですが、 それは思っているものとは違うかもしれません。 真実はいつも・・・ #11 シンプソンのパラドックス 全体で見るか?部分で見るか?分析の違いよって 矛盾した結果が出てしまうこと。 1970年代、バークレー大学は、女性の志願者が男性の志願者よりも合格率が低かったため、性差別だと非難されました。 しかし、問題の原因を突き止めようとしたところ、 個々の学科で、女性の方が男性より

データの誤謬#12 『 マクナマラの誤謬 』

フォード社長、国防長官、世界銀行総裁を務めたスゴ腕エリート 「 歩くIBMコンピューター 」の異名をもつ超秀才とは? #12 マクナマラの誤謬 複雑な状況下で、指標だけに頼り、大局を見失ってしまうこと。 ”真実は、「数値的データ」と「統計的厳密さ」のみから見い出される ”と、信じて疑わなかったアメリカの国防長官ロバート・マクナマラ(1961年~1968年)さんにちなんで名付けられてしまった、なんとも不名誉な誤謬用語です。 マクナマラさんは、ベトナム戦争において、 敵の戦