見出し画像

データの誤謬#11 『 シンプソンのパラドックス 』

” 誤謬(ごびゅう)とは、つまり、間違っていることである。”
データにまつわる誤謬を紐解き、やさしく知るシリーズ(全15回)


「平均値」ってよく耳にしますよね。
どうしても、「普通」とか「中央値」という意味で連想しがちですが、
それは思っているものとは違うかもしれません。
真実はいつも・・・


#11 シンプソンのパラドックス

全体で見るか?部分で見るか?分析の違いよって
矛盾した結果が出てしまうこと。

画像1

1970年代、バークレー大学は、女性の志願者が男性の志願者よりも合格率が低かったため、性差別だと非難されました。

しかし、問題の原因を突き止めようとしたところ、
個々の学科で、女性の方が男性よりも合格率が高いことがわかりました。

全体では低いのに、学科別(グループ, 部分)では高い?

このパラドックスは、男女の受験科目の違い(割合)に起因していました。

女性の応募者は、合格率の低い(競争率の高い)学科で受験する割合が多かったのです。

(イラストの例では、合格率の低いSubject 学科 1 の 女性受験者が1800人となっており、女性受験者全体の90%にあたります。)

このように、「視点(グルーピング)」を変えると、見える結果が異なってきます。

ときに真実は、複雑なデータの隅々に巧妙に隠されているんです。

「平均値」のようなデータを見たら、
全体を構成するグループ(部分)がどうなっているのか?(またその逆)
を探る視点をもつと真実に近づけますよ。

” 真実はいつも・・・データダッシュボードに表示しましょう”


画像2

忙しい毎日、しかし、生産的であるとは限りません。
多くのチームでは、データのカオスに時間を奪われています。

「データの確認」に毎日、何回クリックしてますか?
「数字の読み合わせ」に時間を割くミーティングは効率的ですか?
「深刻なエラー」を見逃さない工夫がありますか?

Geckoboard(ゲッコーボード)で解決できるかもしれません。

あなたがこれから目にするものは、他に類を見ない、見る者の目を奪う「揺るぎないシンプルさ」を追求した、美しいダッシュボードです。

画像3

※当記事は、英ロンドンDatachoice Solutions Limited社とのライセンスに基づいて、転載・加筆しています。

もしかして、あなたが私のnote最初のサポーターですか?😉