Lec2: 相関と因果

皆さんこんばんは。矢野大樹です。今日私は梅田のヨドバシカメラに行ってきたのですが、すごい人でびっくりしました。さて、今日は2回目のミニ講義ですね。相関と因果の違いについて説明したいと思います。その前に、こちらの記事をご覧ください。

今月の11日から13日にかけて、イギリスのCornwallでG7(Group of 7: 先進国首脳会議)が2年ぶりに対面で開催されました。記事の内容としては、サミットが始まる前と比較して、6月13日までの1週間で確認された10万人当たり感染者数が大幅に増加した、というものです。

そして、記事のタイトルに注目してください。ジョンソン(イギリス首相)とバイデン(アメリカ合衆国大統領)が訪れたのち、感染が急拡大したため、G7は『super spreader』イベントになってしまったと書かれています。内容を纏めると、G7が行われたために、その地域における感染が拡大した、というものです。

確かに、ここまで増えると何らかの因果関係があるのではないか、と疑念を持たざるを得ないのも事実です。私も、何らかの関係があるのだろうとは推測しています。ただ、だからといってこの記事を全て鵜吞みにしていいでしょうか。答えはNOです。理由は、感染拡大した別の要因が介在している可能性を常に疑わないといけないからです。

G7が開催されたとして、何故Cornwallで感染者数が増えたのでしょうか?バイデンが来たから?それとも人の流れが通常より活発だったから?会食を伴う会議があったから??? ここまで考えなければなりません。そして、研究者は常にこのことを念頭に置いてデータの分析を行います。これが、因果推論(causal inference)というものです。

つまり、相関と因果は全く別物だということです。より厳密に言うと、相関は因果であることの必要条件(necessary condition)であって、十分条件(sufficient condition)ではないということです。

模式図で書くとわかりやすいですね。

画像1

相関とは、Xが増える(減る)とYも増える(増える)、あるいはXが増える(減る)とYは減る(増える)みたいな関係性のことです。高校1年生の数学Ⅰ『データの分析』で相関係数というものを学習したと思いますが、あれは相関の強さを数値化したものです。ただし、因果との決定的な違いは、別の要因ZがX、Yそれぞれに影響を与えている可能性があるということです。つまり、このとき、Xが原因で、Yが結果という関係性にはなっていないという事に留意する必要があります。

日本の江戸時代にできたことわざで、『風が吹けば桶屋が儲かる』というものがあります。このことわざの意味は、ある事柄が発生することにより、全く関係性のないと思われる場所に影響が生じることがあるという意味です。

これは風が吹いたことが原因で桶の需要が高まったわけではありません。この2つに直接的な因果関係は存在しません。流れとしては以下の通りです。

画像2

このように、一見すると相関があるから因果関係もありそうなものであっても、突き詰めて見れば全く関係が無かった、なんて話もよくあるので、気を付ける必要があります。

特に、最近ではSNSの発達により、デマの拡散が急速に進行することもあります。ワクチンを接種した翌日に亡くなった人がいるからワクチンは有害だ、なんていう話が今でも拡散していますよね。問題なのは、どこの誰とも知らない人間が拡散しているならまだしも、メディアがこうした怪しげな情報を意図的に流していたり、インフルエンサーと呼ばれる社会的に影響力のある方がこうした怪しい情報を意図的ではないにせよ拡散してしまうということです。こうなれば、収集がつかない事態になってしまいます。

私は、学習塾で生徒たちに『世の中の事象を常に疑う姿勢を忘れるな』とよく言っています。これは世の中の事象を何でもかんでも疑え、という意味ではありません。もう既に証明されている三平方の定理みたいなものを疑っても仕方ありませんからね。そうではなく、今まで当たり前のように盲目的に信じてきた事柄を、一歩立ち止まって、俯瞰した目線で見つめなおすということです。その一つの手段として、相関と因果の違いを考えてみるというのは極めて有効なものと言えるでしょう。

とは言え、私自身もまだまだです。目の前の情報に飛びついてしまうこともあります。なので、私自身もしっかりと自覚をしないといけないなと常々思います。皆さんも、相関と因果の違いをしっかり押さえることで、世の中の情報を疑ってみるという姿勢を持ってみてください。世の中の見方が変わるかもしれませんよ。

来週は、いよいよ単回帰分析に入っていきます。来週は基本的なモデルの構造と、専門用語について解説していきます。7月中は全て単回帰分析を扱います。非常に重要かつ、計量経済学を学ぶ者にとっては最初の難所になります。大変だとは思いますが、出来るだけわかりやすく解説するつもりなので、ぜひ最後までご覧ください。

Best,

Daiki

この記事が気に入ったらサポートをしてみませんか?