見出し画像

データの誤謬#2『データドレッジング』

” 誤謬(ごびゅう)とは、つまり、間違っていることである。”
データにまつわる誤謬を紐解き、やさしく知るシリーズ(全15回)


サラダにかけるアレではありませんよ。
まあでも似ているので、
水底をサラう、ドレッ「ジ」ングと覚えちゃいましょう!


#2 データドレッジング

相関関係が実際には”偶然の結果”であったことを認めないこと

画像3

何かしらのパターンを見つけようとして繰り返し検証していくうちに、たまたま偶然、統計的に有意な結果が出てきたことに対して、それを信じて疑わないことです。

歴史的に見ても、研究者が結果を「データドレッジング」して、都合の良い結果に結びつけるため、”データの対象”をすり替えてしまうことが多々ありました。過去の科学雑誌に掲載された多くの結果が、後になって間違っていたことが証明されたのもこのためです。

”魅力的な” または ”見込みのありそうな”パターン(データ)をいいとこ取りしてしまっているんですね。

データを分析して結論を出す際は、データドレッジングの危険性を十分認識して取り組まねばなりません。有意な結果が出てもすぐに鵜呑みにはせず,追試により一貫して同じ結果が出ることをしっかり確かめましょう!ってことですね。

おまけ:ドレッジング - dredging 浚渫(しゅんせつ)
港湾・河川・運河などの水底を浚(さら)って土砂などを取り除くこと。通常、船などからショベルを使って何度も何度も浚うことから、ここでは、水底の土砂を”データ”になぞらえているのですね。

画像1

忙しい毎日、しかし、生産的であるとは限りません。
多くのチームでは、データのカオスに時間を奪われています。

「データの確認」に毎日、何回クリックしてますか?
「数字の読み合わせ」に時間を割くミーティングは効率的ですか?
「深刻なエラー」を見逃さない工夫がありますか?

Geckoboard(ゲッコーボード)で解決できるかもしれません。

あなたがこれから目にするものは、他に類を見ない、見る者の目を奪う「揺るぎないシンプルさ」を追求した、美しいダッシュボードです。

画像2

※当記事は、英国ロンドンDatachoice Solutions Limited社とのライセンスに基づいて、転載・加筆しています。

もしかして、あなたが私のnote最初のサポーターですか?😉