見出し画像

データの誤謬#7 『サンプリングバイアス』

” 誤謬(ごびゅう)とは、つまり、間違っていることである。”
データにまつわる誤謬を紐解き、やさしく学ぶシリーズ(全15回)


イラストには、犬がいっぱい。
犬と一緒にいる犬のTシャツを着た女性に、
男性が「犬と猫どちらが好きですか?」と尋ねてます。
なんと答えますかね?(笑)


#7 サンプリングバイアス

母集団を代表していない偏ってサンプリングしたデータから結論を導き出すこと。

画像1

世論調査で、調査員独自の抽出や分析者の偏見によりサンプリングしたせいで、そもそも参加した人々が総人口(母集団)を代表していないデータから結論を導き出すことがサンプリングバイアスです。

有名な例では、1948年のシカゴトリビューン紙。

電話調査に基づいて、トーマス・E・デューイが次期米国大統領になるとの予想を元に誤報し、大失態を起こしてしまいました。

当時、そもそも電話を買えるのは特定の富裕層だけで、それは共和党とデューイの支持者が圧倒的であることを考慮していなかったため、調査対象とすべき母集団として適切ではなかったということです。

調査対象者が本当に調べるべき母集団の代表者であるか?
をきちんと考慮してみることが大事ですね。

おまけ:粋なトルーマン
デューイに勝利したトルーマンが、シカゴトリビューン紙の誤報「デューイ、トルーマンを破る」の見出し記事を掲げ、笑う写真が現存します。
伝えられるところによると、勝利後のトルーマンはこの記事を見て、「私の聞いた話(私が勝利)とは違うな」(That ain't the way I heard it!)と言って笑っていたそうです。

画像2

忙しい毎日、しかし、生産的であるとは限りません。
多くのチームでは、データのカオスに時間を奪われています。

「データの確認」に毎日、何回クリックしてますか?
「数字の読み合わせ」に時間を割くミーティングは効率的ですか?
「深刻なエラー」を見逃さない工夫がありますか?

Geckoboard(ゲッコーボード)で解決できるかもしれません。

あなたがこれから目にするものは、他に類を見ない、見る者の目を奪う「揺るぎないシンプルさ」を追求した、美しいダッシュボードです。

画像3

※当記事は、英国ロンドンDatachoice Solutions Limited社とのライセンスに基づいて、転載・加筆しています。

もしかして、あなたが私のnote最初のサポーターですか?😉