見出し画像

[Rによるデータ分析入門]変量効果モデルと相関変量効果モデル(1)

本コラムでは、最近使われなくなってしまった変量効果モデル(Random Effect Model)の問題点について、さらに変量効果モデルの問題点を克服する相関変量効果モデル(Correlated Random Effect Model)について紹介します。第一回は変量効果モデルとは何か、そしてその問題点について紹介します。


変量効果モデルとは何か?

一昔前のテキストにはパネル・データ分析といえば、変量効果モデルと固定効果モデルを推定して、ハウスマン検定を実施して、どちらかを選ぶ、という作法が紹介されていました。しかし、最近では、固定効果モデル一択となり、学会発表でも査読付き学術誌でも変量効果モデルを使った論文はめっきり少なくなりました。近年、出版された計量経済学のテキストでも紹介されなくなりつつあります。ここでは、その背景を簡単に紹介します。
まず、変量効果モデルとは何か、から始めましょう。次のような回帰式を考えます。

$$
Y_{it}=\beta X_{it}+\mu_i+\epsilon_{it}
$$

ここで$${\mu_{it}}$$は観察できない個体属性、$${\epsilon_{it}}$$はランダムな誤差項です。そして、固定効果モデルは「観察できない個体属性(μ)が説明変数(X)と相関してもよい」と仮定されるに対して、変量効果モデルとは、「観察できない個体属性(μ)が説明変数(X)と相関しない」という仮定を置いたモデルです。

変量効果モデルの場合、観察できない個体属性(μ)が説明変数(X)と相関しないので、観察できない個体属性(μ)を誤差項の一部として推計することができます。つまり、

$$
Y_{it}=\beta X_{it}+\nu_{it} \\
\nu_{it}=\mu_i+\epsilon_{it}
$$

として推計することになります。この新しい誤差項$${\nu_{it}}$$ について、 $${\nu_{it}}$$(t時点の誤差項)と $${\nu_{it-1}}$$(t-1時点の誤差項)の共分散を計算すると、

$$
Cov(\nu_{it}, \nu_{it-1})
=Cov(\mu_i+\epsilon_{it},\mu_i+\epsilon_{it-1})
=E[(\mu_i+\epsilon_{it})(\mu_i+\epsilon_{it-1})]=E(\mu_i^2)\neq0
$$

となります[1]。t-1時点のvとt時点のvの誤差項の共分散がゼロではない、誤差項が系列相関していることになります。このような場合、誤差項が異時点間で相関することを考慮した一般化最小二乗法として開発されたのが変量効果モデルです。Rではplmパッケージのplm関数で変量効果モデル推定が推計ができます。これは本コラムの(3)以降で説明します。

なぜ変量効果モデルは使われなくなったか

なぜ変量効果モデルが使われなくなっているのでしょうか?第一に、現実の経済問題で「Xとμiが相関しない」といった状況が考えにくいという理由があります。たとえば、賃金(wage)と学歴や企業規模、職場の経験年数(X)の関係を推計する賃金関数を考えてみましょう。

$$
wage_{it}=\alpha +\beta X_{it} + \mu_i + \epsilon_{it}
$$

実際の各個人の年収は、観察可能な学歴や企業規模、経験年数だけではなく、個人のコミュケーション能力、集中力やIQといった観察できない要因の影響も受けていると考えられます。こうした要因を考慮するために μiを加えます。そして、この式を固定効果モデルと変量効果モデルのどちらで推計すべきかですが、Xと μiが相関するかしないかによります。この場合、 μiをコミュニケーション能力、集中力やIQとしたときに、これらが高ければ、大学進学率も高いでしょうし、大企業への就職確率も上がると考えれば「Xとμiが相関する」と考えるのが自然です。ここでは年収の決定要因を考えましたが、多くの経済データの場合、変数が相互に関連することが多いのでXと相関しない「観察できない個人属性 」がある場合というのは極めて稀ではないでしょうか。
 第二に、もし「Xと μiが相関しない」状況で固定効果モデルを使用した場合に何か問題が生じるかというと、個体ダミーをいれるとその係数は非有意になるかもしれませんが、異時点の誤差間で相関が生じるという問題が発生する以外では特に問題はありません。固定効果モデルにおける誤差間に異時点間の相関についてはHAC標準誤差(Heteroscedasity Autocorrelation Corrected Standard Error ) で対処できます。
逆に本来固定効果モデルを用いるべき状況、すなわち「Xとμiが相関する」状況で変量効果モデルを使用すると、「説明変数Xと誤差項が無相関」という仮定が満たされなくなり、係数が過大・過少推計されるという問題が生じます。これらの理由を踏まえると、変量効果モデルを積極的に用いる理由はないと考えられます。なお、固定効果モデルと変量効果モデルを選択するハウスマン検定についても問題点が指摘されており、最近はあまり利用されなくなっています。

もう少し詳しく知りたい方のためにいくつか文献を紹介しておきます。まずは奥井先生の論考です。

奥井亮「固定効果と変量効果」『日本労働研究雑誌』No.657, 2015年4月

さらにフォーマルに勉強したい人は、西山先生・川口先生・奥井先生・新谷先生のテキストをおすすめします。第6章10節に解説があります。

第二回では、変量効果モデルの問題点を解消した相関変量効果モデルについて紹介します。


[1] ここで $${Cov(X,Y)=E(XY)}$$、固定効果と誤差項が
$${E(\mu_i\epsilon_{it})=Cov(\mu_i, \epsilon_{it})=0}$$, tとt-1の誤差項は相関しない$${E(\epsilon_{it}\epsilon_{it-1})=0}$$という最小二乗法における基本仮定, という性質を使っています。

 

本コラムは「Rによるデータ分析入門」のWEBサポートページとして作成されました。WEBサポートの一覧は以下を参照してください。

WEBサポートの一覧は以下を参照してください。


この記事が気に入ったらサポートをしてみませんか?