見出し画像

考え方から始める統計学~DID(差分の差分法)

※全文無料です。

前回
https://note.com/kurosaki_kurozu/n/n47d66566dfe1

バックナンバー
https://note.com/kurosaki_kurozu/m/m3dfd9e022558

前回のまとめ

前回はRCT(ABテスト)が使えない場合の手法として、DID(差分の差分法)RDD(回帰不連続デザイン)の2つを挙げました。
しかし、その中身については深く掘り下げることはしなかったので、今回と次回でこの2つの手法について紹介していきます。

DID(差分の差分法)とは

DID(差分の差分法)とは、複数のグループにおいて、ある境界値を含む長期的なデータが得られたときに、グループごとにその境界値前後での平均値の差分を取り、さらにグループ間での差分を取るという手法でした。

この手法のポイントは対象として関心のある介入があったグループに対して、介入がなかった別のグループのデータも必要とするところにあります。
例えば、神奈川県で施行されたある条例の効果を測りたいときには、条例が施行される前後の神奈川県のデータに加えて、神奈川県で条例が施行される前後の埼玉県や静岡県のデータが必要となるということです。

このとき、DIDを使うためにもう一つ必要な条件があります。
それは、神奈川県の条例が施行される前の神奈川県と埼玉県や静岡県のデータの推移が、同じように変化している、つまり平行に推移していることです。
これを平行トレンドの仮定といいます。

平行トレンドの仮定

平行トレンドの仮定については、「おそらくこうなるだろう」という予想であって、必ずこのようになるという証明はできません。
まずは、平行トレンドの仮定が成り立ちそうなグラフを見てみましょう。

画像1

境界値の前で同じように推移しているため、条例の施行がなければ神奈川県の推移も破線のようになると予想できます。
これが平行トレンドの仮定です。

逆に平行トレンドの仮定成り立たなさそうなグラフを見てみましょう。

画像2

青い神奈川県のグラフはそのままに、静岡県のグラフの形が大きく変わっています。
このようなバラバラな形の推移では、平行トレンドの仮定が成り立ちません

境界値の後でそれぞれ別の影響を受けていないか

この例で言えば、神奈川県で条例が施行された後に、静岡県で別の条例が施行され、それが関心のある数値に影響を与えるものである場合、DIDを使うことはできません。

それぞれ別の影響を受けている場合にはDIDは使えませんが、一方で共通の影響を受けた場合にはDIDを使うことができます
つまり、平行トレンドの仮定が崩れないような状況であれば、DIDは使うことができるということです。

DIDを具体例で見てみる

A県とB県はともに春には観光地として多くの人々が訪れます。
しかし、ある感染症の流行により、A県では外出自粛が求められ、一方でB県ではそのような要請は出ませんでした。
このとき、外出自粛要請によって、県外からの移入者がどれだけ減少するかを見積もることを、A県とB県を比較することで考えます

DIDを使うためには、A県で外出自粛要請が出された時点を境界値として、その境界値の前後でのA県の移入者数のデータと、境界値の前後でのB県の移入者数のデータが必要です。

例えば、A県の外出自粛要請前のA県への1ヵ月の移入者数が300万人であり、要請後の1ヵ月で200万人になったとします。
一方でA県の外出自粛要請前のB県への1ヵ月の移入者数が200万人であり、要請後の1ヵ月で180万人になったとしましょう。

このとき、A県での要請前後の差はマイナス100万であり、B県での要請前後の差はマイナス20万人で、これら2つの差は80万人です。
要請前のA県とB県の移入者数の差は100万人であり、要請後の移入者数の差は20万人で、これら2つの差はやはり80万人です。
この結果から、A県での外出自粛要請によって、A県への県外からの移入者数は80万人減ったと分析することができます。

最後に

今回はDID(差分の差分法)についての解説でしたが、次回はRDD(回帰不連続デザイン)について同様に解説を行う予定です。

ここまで記事を読んでいただき、ありがとうございました。これより下に本文はありませんが、記事が良かったと思ったらご支援をお願いいたします。

ここから先は

0字

¥ 100

この記事が気に入ったらサポートをしてみませんか?