見出し画像

【読書】伊藤公一朗『データ分析の力 因果関係に迫る思考法』【基礎教養部】

以下のサイトで簡潔な書評(800字書評)を公開しています。


本記事作成の背景

本書は計量経済学と呼ばれる学問(の中のさらに一分野)についての入門書である。私は大学で計量経済学を専攻しているので、自分の専門の入門的内容を扱った書籍ということになる。といっても、そういった内容について自分の専門性も交えて詳しく語るため、という意図で本書を課題図書として選んだというわけではない。むしろ、自分が専門的に学んでいる分野を人に紹介してみるということを通して、自分という人間の一側面を「発見」してもらいたいという意味合いが強い。実際、こういった大学で学んでいる内容についてはほとんど語ってこなかった(noteのようなオープンな場だけでなく、自分が所属しているコミュニティ内部も含め)。よって、ここで一度そういった事柄を文章にしてみるのも悪くないだろうと思った次第である。

そのような背景があるので、本書の内容としてメインパートを占めている具体的な分析手法については、このnoteではあまり詳細には説明しないつもりである。もちろん、専門的に学んだ知識を活かし、数学的記述を交えて本書よりも厳密な形で理論を解説することもできるだろうが、それは先述の意図にそぐわないだろうと感じている。分析手法の考え方や具体的な適用事例について知りたい場合は、実際に本書や関連する教科書を紐解いてみてほしい。

それを踏まえて、本記事の主題としたいのは、計量経済学における主要な問題意識の1つ、つまり、データを用いて因果を推論するプロセスにおいて何が問題となるのかについてである。より具体的には、本書で特に第1章で論じられているテーマを中心に、いくつかの補足的な事項を記述することになるだろうか。そこで提示される問題の解決策として多くの分析手法が開発されているわけだが、やはりそれらに普遍的に見られる問題意識(≒自分が興味を惹かれている事柄)について焦点を当ててみる方が、自分の「味」を出しやすいだろう。ということで、以下ではそういったトピックに関する内容について述べていきたいと思う。

計量経済学とは

冒頭でも述べた通り、『データ分析の力』は、計量経済学の一領域──学術的には一般に「プログラム評価(program evaluation)」と呼ばれる──を扱ったものである。その一方で、本書は計量経済学という学問そのものについての解説は行なっていない。よってここでは、その役割にはどのようなものがあるのかについて簡単に説明しておきたい。

観察データを用いた分析

計量経済学の主要な役割の一つとして、本書で扱われているような、観察データを用いた分析というものが挙げられる。ここでの目標はひとえに、対象を観察して得られたデータから「(妥当な)因果関係」を推論することである。最終的なゴールはこのように一言で簡単に言えてしまうが、しかし大前提として、観察データを用いた因果関係の分析は極めて難しいものであるということには注意しておかなければならない。ここでは簡単な例で因果推論の難しさについて説明してみよう。

よく挙げられる例として、商品の広告が売り上げに与える影響を分析したい、という状況がある。ここでは、商品の広告費を増額したところ、その商品の売り上げが大きく伸びたというデータが得られたとしよう。この事実から、広告費の増額は売り上げの増加に寄与すると結論づけることは妥当だろうか。

このような言い回しを用いたからには大方予想できるかと思うが、このデータだけでは、売り上げの増大は広告費増額の効果であると判断することはできない。なぜなら、他に売り上げに寄与する要因がいくらでも考えられるからである。より考えやすくするために、この企業はアイスを製造・プロモートしており、販促のために昨年よりも7月における広告費を増やしたという状況を想定してみよう。7月の売り上げは去年よりも大きく伸びていることがデータから分かっているが、それは広告の効果と言えるだろうか。実際には、例えば去年と比べて今年の7月の方が猛暑であり、そういった考慮しきれていない要因が売り上げに対して正の影響を与えただけではないだろうか。

もちろん、この例では「気温」というデータが容易に手に入る指標が大きな影響を与えていることがすぐにわかるので、そのような要素を考慮して(専門的に言えば「コントロール」して)分析を実行すれば良い。しかし現実には、データがなかったりそもそもデータ化できないような要因が影響を与えているという状況も少なくない。例えば、ある自治体は私立学校進学に対する補助金を拠出することを考えており、そのために私立学校での教育が学力(ペーパーテストの結果)に与える影響を調べたいとしよう。ここでもやはり、私立学校の学生がそうでない学生と比べて学力が高い(あるいは低い)というデータが出たからといって、それが因果関係を示していると結論することはできない。学力の高さに寄与する要因として考えられるのは、私立学校で学んだ効果だけではない。親の教育への熱意などの観察不可能な要因が、子供の学力の向上と子供の私立学校進学率のどちらにも影響を与えており、その結果として私立学校進学と学力との正の相関が発生しているのかもしれない。あるいは、負の相関があるという結果が出たとしても、例えば私立学校への進学を希望する子供は部活動に打ち込みたい者が多く、その熱意は学力に負の影響を与えるため、見かけ上の学力が低く出ているだけで、私立学校の教育が逆効果であると結論することは誤りかもしれない。

このように、ある変数の影響を他の変数の影響と区別することができないような状況を、専門的には「識別(identification)ができない」という。変数の影響の識別を妨げるような要因は様々だが、それを適切にモデル化した上で、観察データを用いて因果関係が推定できるのはどのような場合かという問いに答え、さらにそういった因果推論のための統計的手法を開発することが、計量経済学の大きな役割の一つである。

ただし、近年ではランダム化比較試験(RCT)によって、自然科学と同じように「実験」データを得るというアプローチも主流となってきている。現実に適用するためにはコストや倫理的問題など様々な壁もあるものの、先ほど述べたような問題の多くを解決する非常に強力な手法であることは言及しておきたい(詳しくは本書の第2章を参照してほしい)。

 その他の役割や理論

因果推論は近年では計量経済学においてホットトピックの一つではあるが、それだけがこの学問の全てではない。より古典的な目的としては、経済学のモデルをデータに当てはめて分析するということも挙げられる。

例えば、経済学における消費者理論によって、需要が価格 $${p}$$ についての線形関数で表されることが導かれたとしよう。経済理論からは、$${p}$$ が上昇すると需要が下がるという定性的な含意が得られるが、しかし、価格の上昇がどの程度需要に影響を与えるかという定量的な情報(つまりここでは、線形な需要関数における $${p}$$ の係数の値)を教えてくれるわけではない。こういった問いに現実のデータを用いて答えるというのも、計量経済学が古典的に果たしてきた役割である。

さらに、経済データというのは、それ自体に特徴を持っていることがある。代表的なのは時系列構造で、GDPなどのマクロデータや株価などが例として挙げられる。このような特異な構造をもつデータについて、モデルを定式化し分析する手法を考えるという役割もあり、時系列データ分析は計量経済学における一大分野として発展してきた。

このように、本書で扱われているのは計量経済学が長年開発してきた手法のうちごく一部のみであることは意識しておいても良いだろう。著者も、数学的記述の関係で本書で掲載できなかった有用な手法が数多くあることを言及している。本書はあくまで計量経済学の一分野について、紹介する手法も絞って解説しているものであり(そのチョイス自体は初学者に配慮されたものであることは断っておく)、計量経済学の全体像を知る目的としては不十分であることは認識しておく必要がある。

専門性と教養(結びに代えて)

さて、ここまで長々と述べてきたものの、実はまだまだ書ききれていないことがたくさんある(特に因果関係の捉え方データ分析の限界について)。時間の関係で今は文章にできていないものの、下書きはあるので、また冬休み中に勉強を進めていく中で加筆していくことにしたい。

しかしながら、記述があまり専門的な内容に寄りすぎても、それは基礎教養部の活動として見たときに不適切なものになってしまいそうなので難しいところである。誤解を恐れずにいうなら、教養とは様々な物事を「ゆるく」「適当に」語るための素養であり、それは自分の専門の中(=自分が確実に正しいと言える領域の中)に閉じこもっていては養えないものなのである。つまり、専門性に頼れば頼るほど、そういった「教養」的態度とは離れていくジレンマがある。ならば思い切って、自分の専門について「ゆるく」語ってみることも大事なのではないか。本書の選択と本記事の執筆の動機について振り返ってみると、そうした理由づけもできそうである。

最後に、専門性と教養の文脈から言えば、本書はデータ分析や計量経済学の「教養的理解」のための素材としてはかなり良いものであると思う。もちろん、理論的には入門の入門レベルであって、本書だけで勉強が完結することは決してない。しかしながら、本書をステップとして初級の因果推論や計量経済学の教科書を読むこともできるし、説明も必要十分、実証研究の例も豊富(何なら下手な日本語の計量経済学の教科書よりも!)である。よって、本書をぜひ「教養」として読んでもらい、計量経済学に興味を持ってもらえれば嬉しく思う。


この記事が気に入ったらサポートをしてみませんか?