見出し画像

「データ分析の力・因果関係に迫る思考法」を読んでの感想

今回は「データ分析の力・因果関係に迫る思考法」の感想を記載します。

この本を一言で言うと「因果関係の超入門書」でした。
因果関係について数式を使わずに、
生活に馴染みのある例を使って説明されてます。

気になった方は購入して読んでみてください。

そもそも因果関係とは

一言で言うと「原因と結果の関係」です。
Aが原因のときBが変動する、と表現できます。

因果関係にある代表的な例としては「気温とアイスの売り上げ」です。

「気温が高くなる」が原因Aで、「アイスの売り上げ」が結果Bだとします。

この2つは因果関係にあるので「気温が上がればアイスの売り上げが上がる」と言えます。

相関関係と因果関係が区別できず誤ってしまう人もいますが、2つは全く違うものです。

詳しく知りたい方は下記のURLを参考にしてください。

第1章:なぜデータから因果関係を導くのは難しいのか?

この章では「因果関係を求める難しさ」をわかりやすく解説してくれてます。

先ほどアイスの売り上げについて記載しましたが、もしかしたら気温ではなくアイスの値段が下がって需要が高まった為、販売量が増えてたのかもしれません。

この様に「もしかしたら他の要因が大きな影響を与えてるのでは?」という事実も考慮しないといけないため、因果関係を導くのは難しい。

上記の様な内容を具体例を出してわかりやすく記載されてます。

第2章:ランダム化比較試験(RCT)

ランダム化比較試験(RCT)についての解説です。

因果関係があるかないかを調べるために「介入効果」を定義します。
例えば、「電力の価格を上げると節電に繋がるのか?」と言う問題を考えてみます。

電気の価格が上昇した場合の料金をA0とし、電気の価格が上昇しなかった場合の価格をA1とします。この時A0とA1の差が介入効果によって説明できまう。

本章では「因果関係を求めるのが難しいのは「もしも」のデータがないから」と記載されてます。確かに、電気料金の例を見ても「上がった場合と上がらなかった場合」が同時に存在しません。

そこで、「介入グループ」と「比較グループ」を作り因果関係を求める方法とその注意点を解説してるのが第2章です。
この章もとても分かりやすく解説されてます。

第3章:「境界線」を賢く使うRDデザイン

この章では「RCTが行えない場合の因果関係も求め方」の1つとしてRDデザインを解説してます。RCTが行えない場合(費用面や人員面などで)に「あたかもRCTを行なった様な状況を上手く利用する」といった分析方法です。

例として「医療費と医療頻度」について記載します。

医療費の窓口負担は、6歳までは2割負担、69歳までは3割負担、70歳から74歳までは原則2割負担、75歳以上は原則1割負担です。

ここで「もしも医療費が医療サービス利用者数に影響があるなら、69歳までの医療サービス利用者の方が70歳からの医療サービス利用者の方が少ないのではないか?」との仮説ができます。

この様な社会的に実装されてる「境界線」を使って因果関係を調べる方法が「RDデザイン」になります。

こちらも分かりやすく解説されてました。

第4章:「階段状の変化」を賢く使う集積分析

世の中には所得税や国からの補助金など、何らかのインセンティブが「階段状」になってるものがあります。これらのデータを使って因果関係を求めれないかと言う考えが「集積分析」です。

本書では「車の燃費」について記載されてます。

日本では「重量が軽いほど燃費の制限が厳しく、思いほど緩い」と言うルールがあります。地球温暖化対策のための施策ですが、ひとまず置いといて「こんなルールがあるんだ」位で大丈夫です。

この「緩い・厳しい」の境目が階段状になってて「xxkg以上なら〇〇」といった様なルールが作られてます。

境界線があるので「RDデザインと同じでは?」と思われるかもしれませんが、明確に違います。

ここら辺は本書でわかりやすく記載されてるので是非読んで頂きたいです。

第5章:「複数期間のデータ」を生かすパネル・データ分析

もし2つのグループが同じ様なデータをしていた時、片方が何らかの介入がされた時2つのグループでどの様な差が生まれるかを分析し、因果関係を探る手法です。

例えば、東京と大阪の2つのグループがあります。
この2都市では売り上げが2000年までほぼ同じ様な推移でしたが、東京のみCMを流す様になりました。

それ以降、今まで同じ様な推移(平行)だった売り上げの差が大きくなってきました。

この時、「CMは売り上げに影響する」という仮説ができます。

このように複数期間のデータを使うことで因果関係を導く手法です。
この方法のメリットやデメリットなどもわかりやすく記載されてます。

第6章:実践編・データ分析をビジネスや政策形成に活かすためには

この章ではデータ分析の生かした方について、具体例を使って解説されてます。

ビジネス面で見ると「広告により売り上げが影響されるか」や、政策形成では「補助金(施策等)で景気は良くなったのか」などかなり噛み砕けばこの様なことです。

また、そのために「企業と分析専門家」の協力関係を築く必要性や、データを簡単に扱うための環境作りの大切さにも触れられてます。

第7章:データ分析の不完全性や限界を知る

ここまではデータ分析の良さを解説してきましたが、この章では「それでもデータ分析は完全ではないし、限界がある」と言う事実が解説されてます。

例えば「分析に使うデータ」に問題があったとします。

いくら優秀な人材がいたとしても、使うデータが正常でない場合は正しいデータ分析ができません。

この様な失敗をしないためにもデータの収集方法や、設計は大切ですね。

まとめ

因果関係を数式を使わないで直感的に理解したい、という方におすすめの本です。最初に書きましたが、「因果関係の超入門書」です。

因果関係について触れてみたいという方は購入して読んでみてください。


サポートして頂いたお金は開業資金に充てさせて頂きます。 目標は自転車好きが集まる場所を作る事です。 お気持ち程度でいいのでサポートお願い致します!