見出し画像

考え方から始める統計学~因果関係を推測する②

※全文無料です。

前回
https://note.com/kurosaki_kurozu/n/n56b8cf432ec8

バックナンバー
https://note.com/kurosaki_kurozu/m/m3dfd9e022558

前回のまとめ

前回の記事では、「因果関係を推測する①」と題して、主に次の3つについてお話ししました。
1. 相関関係からただちに因果関係があるとは言えないということ。
2. 原因と結果の関係が一見はっきりしているようでも、実際には他に原因となりうる可能性をいくらでも挙げられること。
3. データをより多く集めただけでは消えない偏りがあるということ。

例えば、「商品の購入時に割引に使えるポイントを付与したところ、商品の売り上げが前年度よりも伸びた」というデータがあったとしましょう。
しかし、これからポイントを付与したこと(原因)によって、商品の売り上げが伸びた(結果)とただちに言うことはできないのです。

もちろん、ポイントの付与によって伸びた売り上げ分もあるでしょう。
一方で、商品の内容が暖冷房機器であればその年の気温によっても売り上げは左右されるでしょうし、健康食品であれば人々の健康志向の高まりによっても売り上げは左右されるでしょう。
このとき、気温を数値化することは容易ですが、人々の健康志向の高まりを数値化することは困難です。
つまり、ポイントの付与以外にも商品の種類によって、数値化が容易なものから困難なものまで複数の原因を考えることができるのです。

また、ポイントを付与した対象が、すでにその会社の商品を買ったことがある人であれば、そうでない人と比べて、同じ会社の商品を購入しようという傾向が強いと考えられます。
そのため、ポイントの付与によって純粋にどれだけ売り上げが伸びたかというのを調べるときに、調査対象の偏りのせいでその効果を過剰に見積もってしまうことがあります。

原因を切り分けることの難しさ②~検証の難しさ

原因が対象にどれほど影響を及ぼしたのかを調べたいときには、同じ条件の対象を複数用意して、影響させた対象と何もしなかった対象が結果的にどのような状態になったのかを比較することが必要です。
この理屈で言えば、薬の効果を検証したいときには、ある人が病気にかかったときに、薬を投与した場合と投与しなかった場合とを比較する必要があります。
実際には薬を投与してしまえば、薬を投与しなかった場合の結果は観測できませんし、薬を投与しなければ、薬を投与した場合の結果は観測できません

この例のように、どちらかの結果を観測しようとした場合、もう片方の結果が観測できなくなることは、因果推論における根本的な問題です。この問題を現実的に解決する方法の1つは、原因の有無以外の条件ができるだけ同じになるように対象を選び出すことです。

偏りをなくす~ランダム化比較試験(RCT)

ランダム化比較試験(RCT)の目的は、先ほどの薬の例で言えば、薬を投与する対象と投与しない対象を、薬の有無以外の条件をできるだけ同じようにして比較することです。
そこで、1人ではなくもっと多くの人々を調査の対象として、その人々もランダムに選び出すことで、対象の偏りをできるだけ平均化して少なくするという手法を用います。これがRCTの概要です。

では、実際にRCTはどのように用いられるのでしょうか。
引き続き薬の例を使うと、薬の有無以外に体調に影響を及ぼす原因、対象の年齢や性別や食生活や運動の有無などの条件を全て同じにしなければ、正しい比較ができないというのが因果を推測するにあたっての前提です。
RCTではこれを解決するために対象をランダムに選び出します

例えば、1万人の人々を選んで、そのうちランダムな5000人に商品の割引券を配って、残りの5000人には何も配らないことにします。
そして、しばらくした後に2つのグループが商品を購入した割合を比較します。
一方で、5000人のグループをランダムに選ばず、割引券を付与する対象を商品の購入頻度が高い順などとしてしまうと、明らかにこの5000人は割引券の有無に関わらず、もう片方の5000人よりも元々の購買意欲が高い人々であるため、比較によって割引券の効果を正しく検証することができなくなります

結局のところ、RCTという手法の重要な点は、グループ分けを完全にランダムに行うことで、グループごとの偏りを平均化して無くすことです。
比較したい原因の有無以外の要因を平均化して無視できるようにするわけです。
全く同じ対象を複数用意することができなければ、平均的に同質な対象を複数用意して比較すればいいという発想ですね。
余談ですが、マーケティングなどの分野では、この手法をABテストと呼ぶようです。

最後に

前回から続く話はひとまずここで一区切りとなりますが、次回も因果関係についてのお話を続けていきます。
具体的には、RCT以外の調査方法の紹介などの、次々回以降に繋げるためのお話がメインになると思われます。

ここまで記事を読んでいただき、ありがとうございました。これより下に本文はありませんが、記事が良かったと思ったらご支援をお願いいたします。

ここから先は

0字

¥ 100

この記事が気に入ったらサポートをしてみませんか?