見出し画像

【マルチレベル】押さえるべき要点や特徴を整理した、マルチレベル分析の「はじめの一歩」(小川, 2019)

今回は、マルチレベル分析の特徴をまとめたレビュー論文を紹介します。かなり分析に特化した文献なので、興味のある方は限られるかもしれません。データ分析に多少興味ある、と言う方におススメの回です。

小川悦史. (2019). マルチレベル分析の特徴と HRM 研究に関するレビュー. 日本労働研究雑誌


どんな論文?

この論文は、マルチレベル分析における考え方を確認・整理すると共に、人事関連の変数をマルチレベル分析で分析した研究を紹介するものです。

マルチレベル分析とは、以下の図にあるように、下に行くほどミクロに、上に行くほどマクロになるような階層データを同時に扱う分析です。

難しいのは、この階層が「入れ子構造」になっている点です。たとえば、グループのエンゲージメントを変数として扱う場合、グループと一口に言っても、個人のバラつきは異なる可能性があります。

言い方を変えれば、取得したデータには、集団単位の情報と、個人単位の情報の両方が含まれる、それぞれに関係性もあり得るため、分析には注意が必要となるわけです。




なぜ、マルチレベル分析が必要なのか?

これまで、過去の投稿でも「集団(チーム)レベル」と「個人レベル」、2つのレベルを分けて分析した研究を紹介してきました。

マルチレベル分析の大きな特徴は、異なるレベルのデータを扱えることです。つまり、集団レベルの変数(例えば、組織風土)が、個人レベルの変数(例えば、組織コミットメント)への影響を見ることができます。

逆に言えば、異なるレベルのデータは、適切に扱わないと間違いやミスリードしてしまう、という危険性があり、専門的かつ複雑な「マルチレベル分析」というものが、少しずつ研究領域で増えてきているようです。

文献では、大きく2点の過ちについて触れています。

①独立性の仮定への違反
これは、ある特定の集団内で観測されたサンプル同士は、ランダムに収集されたサンプルよりも似ていると考えられることによるものです。

例えば、組織でデータを取る際、あるチーム/職場の心理的安全性を取ることを想定してみましょう。この心理的安全性は、職場について聞いているので、チーム単位だと似たような回答が集まりやすくなることが想定できます。

このように、集団と個人が入れ子になっている組織構造の場合、データの独立性が仮定できない、という間違いが起こりえると説明されます。

②解釈上の問題点
こちらの方がイメージがつきやすいと思います。簡単に言うと、階層的なデータの場合、その影響が、個人の影響なのか、集団の影響なのかが解釈上難しい、ということです。文献内の例がわかりやすいので、そのまま引用します。

たとえば,複数の企業とそこに所属する従業員それぞれからサンプリングし,営業成績と通勤時間(1 時間以上を1,1 時間未満を0)との関係を明
らかにしようとしたとする。t 検定で営業成績の平均値を比較した結果,仮に1 時間未満の従業員の成績の方が,1 時間以上の従業員よりも有意に高いことが明らかとなった。この場合,従来的な解釈では「通勤時間の短い従業員の方が,長い従業員よりも営業成績が良い」のようになる。しかし,今回のように階層的なデータでかつ企業間に差があったとすると,必ずしもそうとはいえない。すなわち,上記のような個人単位の解釈にくわえて,「通勤時間が短い企業の方が,営業成績が良い」のような企業単位での解釈も考えられる。

P34

マルチレベル分析で押さえるべきこと

この文献では、マルチレベル分析を通じて考慮が必要な、いくつかの要素を紹介しています。

1.級内相関係数(intra-class correlation coefficient: ICC)
ICCは、データの独立性を識別するための、集団類似性を評価する指標
です。ICCは集団レベルの分散を表すもので、ICC=0、つまり、集団の分散がゼロであれば、集団の効果がない状態、逆に1であれば、すべての分散が集団レベルで説明されます。

清水(2014)では、ICCが有意で、かつ、0.1(あるいは0.05)を超えていればよい、とされるようです。つまり、集団の分散が0.1以上であれば、集団レベルの影響が認められ(個人レベルのみ、ではなくなる)、データに階層性がある、と判断できるようです。

また、級内相関係数に似たものとして、ICC(2)(内的一貫性指標)があげられます(クロンバックのαもこれにあたるとのこと)。こちらは0.5以上あれば、信頼性あり、とされるようです。

(ほかにも、合意性指標(Within group interreter reliability:コーエンのカッパ係数などがこれにあたるとのこと)も使われるようです。これは0.6か0.7程度あればよいとのこと)


2.固定効果と変量効果
マルチレベル分析には、固定効果(fixed effect)と変量効果(random effect)と呼ばれる要素があります。その名の通り、固定効果は定数(平均値など)で表され、変量効果は分散成分として捉えます。

数学的な回帰直線を想定すると(むずかしいですね・・・・)、1チーム当たり1本の直線が引けるため、100チームあれば、100本の直線が出来ます。簡単に言えば、その100本には、切片や傾きにばらつき(分散)=変量効果があり、100本を平均化すると1本の直線が引ける=サンプル全体の固定効果と表せるわけです。

マルチレベル分析とは、この変量効果と固定効果を同時に推定し、集団ごとの回帰式を1つのモデルで表している、とされます。


3.直接効果と調整効果(交互作用効果)
上の数学的な考え方ではありません。変数間の影響関係を見るものです。
直接効果とは、集団レベル変数の、個人レベル変数に対する直接的な効果を指します。
一方、調整効果とは、2つの個人レベル変数間に対する集団レベルの効果、あるいは、集団レベルと個人レベル間に対する、他の個人レベル変数の効果、と定義されています。


感じたこと

マルチレベル分析のポイントをかいつまんで整理している文献であり、初学者にとっては頭の整理になる内容でした。

まずはデータの階層性をおさえるあたりまでは良いのですが、固定効果や変量効果、といったレベルになると、本を読んでも何を見ても数式が載っていることが多く、、、もう少し頑張って、まずは数式アレルギーを解くことから始めたいと思いました。道のりは長そうです。



この記事が気に入ったらサポートをしてみませんか?