見出し画像

恋愛で学ぶ統計学♡(No.13 階層線形モデル: クラスターにはご注意を!)

こんにちは!
今回も、統計学を恋愛のシチュエーションで学んでいきましょう。

この記事の副題にもあるように、統計学では
「クラスター」に注意しなくてはいけないのです!
「クラスター」の意味を辞典で調べると
同種のものや人の、集まり。群れ。集団
となっていました。

最近、「クラスター」という言葉をよく聞くことになりましたね、、、
コロナの影響で、「クラスター感染」という単語を1度は聞いたことがあるのではないでしょうか?
これは、つまり「集団感染」のことです。

では、なぜ、この「クラスター」に注意をしなくては、いけないのでしょうか?
たとえ話をしながら、考えていきましょう!

あなたは、ある高校の生徒です。
そして、あなたはある仮説を思い付いたのです。それは、、、
「学力が高いほど、モテるのではないか」
という、仮説です。

もし、これを調査して、仮説が正しいと分かれば、勉強をするモチベーションもマックスになるはず!
そこで、調査を始めました。

あなたは、次の2つの質問をすることで、この仮説を確かめようとします。

1.これまでに付き合った人数は?
  →この質問で、モテているかを確認します。

2.これまでの学力テストの点数のおおよその平均点は?
  →この質問で、その人の学力を確認します。

では、さっそく質問を始めました。
まず、あなたは、自分が所属するサッカー部の仲間に質問をしました。
すると、結果は下のような図になりました。

サッカー部の10人に聞いた質問結果の散布図

なんということでしょう。
10人に質問をした結果、「学力が低いほど、付き合った人数が多い」となりました。
「いや、これは何かの間違いだ、、、もっと他の部活にも聞いてみよう!」と考えたあなたは、近くにいた野球部にも聞きました。
すると下のような結果になりました。

野球部の10人に聞いた質問結果の散布図

「ん!?今度は、みんな似たような学力だけど、付き合った人数が違う」
つまり、「学力と付き合った人数には関係がない」となるのか?
「いやいや、外部活以外の人たちにも聞いたら何かわかるかもしれない!」

ということで、体育館に突撃し、女子バスケットボール部の人たちにも聞きました。その結果

女子バスケットボール部の10人に聞いた質問結果の散布図

「なんだ?!さらにカオスな結果になった。もう、よくわからない、、、でもまだあきらめない!文化系の部活にも、質問してやる!」
ということで、クイズ研究部に質問しました。その結果

クイズ研究部の10人に聞いた質問結果の散布図

「やった!はじめて僕の仮説と同じ結果になった!」
つまり「学力が高いほど、付き合った人数が多い」という結果になりました。

では、これまで、集めたデータをすべてあわせたグラフを見てみましょう。

4つの部活の40人に聞いた質問結果の散布図

どうでしょうか。すべてのデータでみる
全体に散らばってしまっているので、
「学力と付き合った人数には関係がない」
という結論になってしまいます。

しかし、クイズ研究部では、確かに、仮説通りであったのです。また、サッカー部では、仮説とは違いますが、学力と付き合った人数には「学力が低いほど、付き合った人数が多い」という関係がありました。

このように部活というクラスター別に分けて考えると、ある関係性が見えるのに、クラスターを無視して、全体で見てしまうと、関係性はないという結論を導いてしまうのです。

このことから、統計学では、自分が調べる対象(データ)が、クラスター性(集団性)があるかどうかを確認しなくてはいけないことがわかります。

もしも、無作為抽出を大規模に行うことができれば、問題がないことが多いです。他にも、科学実験の分析であれば、クラスター性を考えることはしなくてもいい場合が多いでしょう。しかしながら、社会科学や教育学のように、社会集団や学校などを対象にする場合は、この「クラスター」に注意しなくてはいけません。人間は、必ず何かの集団に属していると考えられますからね、、、

このクラスターを考慮した分析は、いくつかあります。
例えば、階層線形モデル (別名︓「マルチレベルモデル」,「ランダム効果モデル」)と呼ばれるものがあります。

この階層線形モデルが詳しく書かれたオススメ書籍は下のリンクに貼っておきます。

本来なら、関連性がないと判断されるような結果も、クラスターを考慮することによって、なにか関係性を見つけることができるかもしれません。

今回のたとえ話の場合、部活ごとに質問をせずに、40人分のデータを集めていたら、部活によって、異なる性質があることはわかりませんでした。そして、この集団によって異なる結果がわかれば、さらに深い分析も可能になるのです。

例えば、クイズ研究部にいるならば、学力や知識があるほど活躍することができるので、モテやすくなるのではないのかと考えられます。ほかにも、サッカー部は、勉強するよりサッカーの練習をたくさんしていて、テストで点数は取れないけど、サッカー部では活躍をしていて、モテやすくなっているのかもしれません。

そう考えると「学力が高いほど、モテるのではないか」
という、仮説よりも、
「その部活で、どれだけ活躍しているかで持てるかどうかが決まる」という仮説の方が信ぴょう性があります。

こうして、ただ仮説に対して「関係がなかった」と結論付けて終わらず、集団間の分析ができることで、さらなる知見へとつながるかもしれませんね!





この記事が気に入ったらサポートをしてみませんか?