見出し画像

マルチレベルモデルの基礎(+セミナー体験) 付録


級内相関係数の計算法、各モデルの数式と詳しい説明はここで書いています。

級内相関係数の数式

$${\sigma^{2}}$$(集団内の分散)と$${\tau_{00}}$$(集団間の分散)を使って以下の式によって級内相関係数を計算することができます。変数の意味については後述します。

$$
\rho = \frac{\tau_{00}}{\tau_{00}+\sigma^2}
$$

各マルチレベルモデルの数式と詳しい説明

各マルチレベルモデル

ランダム効果の分散分析モデル

ランダム効果の分散分析モデルの式は以下です。

レベル $${1:}$$

$$
y_{i j}=\beta_{0 j}+r_{i j}
$$

レベル $${2:}$$

$$
\beta_{0 j}=\gamma_{00}+u_{0 j}
$$

レベル1は集団内、レベル2は集団間です。
レベル1は結構簡単な数式です。集団jに所属する個人iの値$${y_{i j}}$$は、 集団jの平均$${\beta_{0 j}}$$と、 誤差$${r_{i j}}$$に分解されます。
レベル2も、集団jの平均$${\beta_{0 j}}$$は、全平均$${\gamma_{00}}$$と、誤差$${u_{0j}}$$に分解されます。

下のパラメータを推定します;
$${\gamma_{00}}$$: 全平均、固定効果
$${u_{0j}}$$: $${\beta_{0 j}}$$と$${\gamma_{00}}$$の差、ランダム効果 
$${\sigma^{2}}$$: $${r_{i j}}$$の分散(集団内の分散) $${r_{i j}}$$は平均0、分散$${\sigma^{2}}$$の正規分布に従う
$${\tau_{00}}$$: $${u_{0j}}$$の分散(=$${\beta_{0 j}}$$の分散、集団間の分散 ) $${u_{0j}}$$は平均0、分散$${\tau_{00}}$$の正規分布に従う。

RのlmerTestパッケージで推定したら、$${\sigma^{2}}$$(集団内の分散)と$${\tau_{00}}$$(集団間の分散)をパラメータとして推定して得られます。ちなみに、上記のRのICCパッケージ以外でも、パラメータ推定値の$${\sigma^{2}}$$と$${\tau_{00}}$$を使って以下の式によって級内相関係数を計算することが可能です。

$$
\rho=\frac{\tau_{00}}{\tau_{00}+\sigma^2}
$$

集団・個人レベル効果推定モデル

これから集団・個人レベル効果を推定します。集団・個人レベル効果推定モデルは、個人の集団での相対的位置と集団が全体での相対的位置が必要です。だからここでは集団平均中心化と全体平均中心化を使います。

集団・個人レベル効果推定モデルの式は以下です。二つの線形回帰みたいな数式です。$${b_1}$$と$${\gamma_{01}}$$は傾き、$${\beta_{0 j}}$$と$${\gamma_{00}}$$は切片です。

レベル $${1:}$$

$$
y_{i j}=\beta_{0 j}+b_1\left(x_{i j}-\bar{x}_{. j}\right)+r_{i j}
$$

cwcを行うにより、レベル1の$${b_1}$$は個人レベル効果と解釈されます。
レベル $${2:}$$

$$
\beta_{0 j}=\gamma_{00}+\gamma_{01}\left(\bar{x}_{. j}-\bar{x}_{. .}\right)+u_{0 j}
$$

ここでの説明変数は集団間の違いを表しているので、レベル2の$${\gamma_{01}}$$は集団 レベル効果と解釈されます。

RのlmerTestパッケージで推定したら、$${b_1}$$と$${\gamma_{01}}$$をパラメータとして推定して得られます。個人レベル効果と集団レベル効果を同時に推定することができました。

ランダム切片・傾きモデル

ここでは、ランダム切片・傾きモデルでランダム傾きや切片の分散の推定を推定します。

式は以下です。

レベル $${1:}$$

$$
y_{i j}=\beta_{0 j}+\beta_{1 j}\left(x_{i j}-\bar{x}_{. j}\right)+r_{i j}
$$

レベル $${2:}$$

$$
\beta_{0 j}=\gamma_{00}+u_{0 j}\\
\beta_{1 j}=\gamma_{10}+u_{1 j}
$$

$${u_{0j}}$$と$${u_{1j}}$$はそれぞれレベル1の式の傾きと切片のランダム効果です。$${\tau_{00}}$$($${u_{0j}}$$の分散)と$${\tau_{11}}$$($${u_{1j}}$$の分散)を推定します。$${u_{0j}}$$と$${u_{1j}}$$は2変量正規分布に従います。
RのlmerTestパッケージで推定したら、$${\tau_{00}}$$と$${\tau_{11}}$$、この両者の相関係数をパラメータとして推定して得られます。

また学校の勉強時間と成績の例で言うと、個人レベルで勉強時間と点数の関係を見たい場合には、はじめに勉強時間(説明変数)にCWC(集団平均中心化)を適用します。

i は生徒、j は学校として、

生徒レベル:
$${成績_{ij}=切片_{j}+傾き_{j} \times 勉強時間[cwc] _{ij}+誤差_{ij}}$$ (cwcしたら傾きjは生徒レベルにおける勉強時間と成績の回帰係数となる)
学校レべル:
$${切片_{j} =(切片の)切片 + (切片の)誤差_{j} }$$
$${傾き_{j} = (傾きの)切片 + (傾きの)誤差_{j} }$$

傾き平均(勉強時間の点数への影響)と学校間傾き分散を以上のモデルで計算すると、個人レベルで勉強時間が成績にどう影響するのか、学校によって勉強時間と点数の関連は異なるかを検証することができます。 

切片・傾きに関する回帰モデル


切片や傾きが集団ごとに異なる理由を,集団レベルの変数で説明するモデルです。式は以下です。

レベル $${1:}$$

$$
y_{i j}=\beta_{0 j}+\beta_{1 j}\left(x_{i j}-\bar{x}_{. j}\right)+r_{i j}
$$

レベル $${2:}$$

$$
\beta_{0 j}=\gamma_{00}+\gamma_{01}\left(\bar{x}_{.j}-\bar{x}_{. .}\right)+u_{0 j}\\
\beta_{1 j}=\gamma_{10}+\gamma_{11}\left(\bar{x}_{.j}-\bar{x}_{. .}\right)+u_{1 j}
$$

レベル2の$${\beta_{1 j}}$$をレベル1に代入すると、 $${\gamma_{11}}$$はレベル1の説明変数とレベル2の説明変数を掛けたものがクロスレベル交互作用になります。

$$
\gamma_{11}\left(x_{i j}-\bar{x}_{. j}\right)\left(\bar{x}_{.j}-\bar{x}_{. .}\right)
$$

RのlmerTestパッケージで推定したら、ランダム効果の$${\tau_{00}}$$($${u_{0j}}$$の分散)と$${\tau_{11}}$$($${u_{1j}}$$の分散)、$${u_{0j}}$$と$${u_{1j}}$$の偏相関、そして固定効果の$${\gamma_{00}}$$、$${\gamma_{01}}$$、$${\gamma_{10}}$$、$${\gamma_{11}}$$の値も推定できます。推定された$${\gamma_{01}}$$は集団効果、$${\gamma_{10}}$$は個人効果で、$${\gamma_{11}}$$はこの両者の交互効果になります。

i は生徒、j は学校として、

生徒レベル:
$${成績_{ij}=切片_{j}+傾き_{j}\times勉強時間[cwc] _{ij}+誤差_{ij}}$$ (cwcしたら傾きjは生徒レベルにおける勉強時間と成績の回帰係数となる)
学校レべル:
$${切片_{j} =(切片の)切片 +(切片の)傾き\times学校の勉強時間[cgm]_{ij}+(切片の)誤差_{j} }$$
$${傾き_{j} = (傾きの)切片+ (傾きの)傾き\times学校の勉強時間[cgm]_{ij}+ (傾きの)誤差_{j} }$$

学校レベルの傾きを生徒レベルに代入すると、(傾きの)傾き$${\times}$$勉強時間[cwc] $${\times}$$学校の勉強時間[cgm] という項が現れ、生徒レベルの説明変数(勉強時間)と学校レベルの説明変数(勉強時間)の積がどのように成績に影響を与えるのかを表現できます。これはクロスレベル交互作用です。(傾きの)傾きを計算することによって、個人の説明変数が目的変数に与える影響に対して、集団がどれくらいの影響を与えているかを算出できます。

コードを実際に実行したい方はこの本を買ってRスクリプトとデータファイルをダウンロードして実行してください。


この記事が気に入ったらサポートをしてみませんか?