スピアマンの順位相関係数について

要約

スピアマンの順位相関係数は、2つの変数の間の順序の一致度を測定する統計的手法です。通常、記号ρ(ロー)またはrsで表され、データが正規分布に従わない場合や、順序尺度(ランクなど)のデータに対して使用されます。係数の値は-1から+1までの範囲であり、+1は完全な正の相関を、-1は完全な負の相関を、0は相関がないことを意味します。この係数は、データのランクに基づいたもので、個々の値の大きさには依存しません。

スピアマンの順位相関係数の詳細な解説

1. スピアマンの順位相関係数とは何か?

スピアマンの順位相関係数は、2つの変数のランキングの相関を評価するための非パラメトリックな統計手法です。これは、変数間の直線的な関係を仮定せず、単に一方の変数のランクが増加すると、もう一方のランクも増加する傾向があるかどうか(または逆に減少するかどうか)を測定します。

2. いつ使用するのか?

この係数は特に、データが正規分布をとらない場合や、測定値が順序尺度である場合(例:満足度調査の「非常に満足」「満足」「普通」「不満」「非常に不満」のようなカテゴリー)に適しています。また、外れ値の影響を受けにくいため、データに外れ値が含まれている場合にも有用です。

3. どのように計算するのか?

スピアマンの順位相関係数の計算は以下のステップに従います。

  1. データのランキング:
    各変数の値をそれぞれの順位に変換します。

  2. 差の計算:
    2つの変数の各ペアについて、ランクの差(d)を計算します。

  3. 差の二乗:
    各差の値を二乗します。

4. 結果の解釈

  • +1に近い値: 一方のランクが増加すると、もう一方のランクも増加する強い正の関係。

  • -1に近い値: 一方のランクが増加すると、もう一方のランクが減少する強い負の関係。

  • 0に近い値: 2つのランクの間には関連性がほとんど、または全くありません。

5. 具体例

2つのスポーツ選手の10試合における順位を比較するとします。選手Aが1位から10位までのランクを記録し、選手Bも似たようなパフォーマンスを示した場合、スピアマンの順位相関係数は+1に近い値になり、両者のパフォーマンスには強い正の関連があることを示します。逆に、選手Aが常に高いランクで、選手Bが常に低いランクを記録した場合、係数は-1に近い値になり、強い負の関連があると解釈できます。

6.具体例を用いたスピアマンの順位相関係数の計算

以下は、スピアマンの順位相関係数の計算方法を理解するための実際の例です。

例題:

あるクラスの生徒10人について、数学テストと科学テストの結果が以下のようになったとします。


これらのデータを使って、数学と科学のテストスコアの間にどの程度の相関があるのかをスピアマンの順位相関係数で評価します。

計算ステップ

  1. 各テストスコアの順位をつける:
    各テストのスコアをランク付けします。最高のスコアが1位となります。スコアが同じ場合は、そのスコアの平均ランクを割り当てます(これは同順位処理と呼ばれますが、この例では発生しません)。

  2. ランクの差を計算する:
    それぞれの生徒について、数学テストのランクと科学テストのランクの差(d)を計算します。

  3. 差の二乗を求める:
    各ランク差(d)を二乗して、その合計値(∑d²)を求めます。


次に、相関係数を計算します:


結果の解釈

計算

したスピアマンの順位相関係数は約0.721となりました。これは、数学テストのスコアと科学テストのスコアの間には中程度から強い正の相関があることを示しています。つまり、一方のテストで高いランクを得る生徒は、他方のテストでも高いランクを得やすい傾向にあります。

まとめ

スピアマンの順位相関係数は、2つの変数のランクに基づく関係性を測定する便利な統計ツールです。それはランクデータに対して頑健であり、特に正規分布を仮定できないケースや、順序尺度のデータに適しています。この係数は、データのランクに焦点を当てているため、外れ値や非正規分布の影響を受けにくいのが特徴です。

この記事が気に入ったらサポートをしてみませんか?