見出し画像

【脳波解析】ノンパラメトリック検定

 本ページでは「Analyzing Neural Time Series Data Theory and Practice」(Mike X. Cohen and Jordan Grafman)のChapter33をベースに、ノンパラメトリック検定について、説明をしていきます。
前回のnoteはこちら↓

はじめに

 今までのnoteではじめに、という見出しは作ってません。じゃあなんで作ったの?というと、今回の章は、統計弱々の私なりにまとめたnoteだからです。本当に、本当に、統計わかりません。という状態ですが、手は抜いてません。が、お手柔らかにお願いします。ある意味、統計そんな詳しくないって人にも理解しやすい!と思います。

2つの相関係数(ピアソンvs. スピアマン)

 相関係数の求め方は、データの正規分布を仮定しているかにより異なります。データが正規分布していると仮定、すなわち、パラメトリックの場合はピアソンの相関係数を使います。ピアソンの相関係数は、いわゆる、相関係数、といって、真っ先に想像する相関係数です。ピアソンの相関係数では、2変数の数値をそのままプロットして、相関を分析します。

画像1

パラメトリック検定は正規分布を仮定し、検定統計量は帰無仮説下で期待される分布と比較され、少なくとも観測統計と同じ大きさの帰無仮説下でp値が計算されます。
 一方、データが正規分布していない可能性がある際には、すなわち、ノンパラメトリックの場合は、スピアマンの順位相関係数を使います。順位、というくらいなので、各変数の数値を順位付けし、その順位をプロットして相関を分析します。そのため、そのまま数値を用いるより計算が早くなるというメリットがあり、脳波測定ではスピアマンの順位相関係数を使うことが推奨されます。
 スピアマンの順位相関係数を用いる理由は主に2つあります。1つ目が、データが正規分布していない可能性があることです。データが正規分布していない(ように見える)際、対数変換を用いて正規分布に従わせることは、非常にメジャーなやり方ですが、対数変換をしていても、極端に分布が偏っている場合、あまり効果がない場合があります。次に、データには外れ値を含んでいる可能性があるためです。アンスコムの例をとってみましょう。全く異なるデータ分布でも、データ間で平均や標本分散が完全一致したり、2変数の相関係数、回帰直線がほぼ一致することがあります。スピアマンの順位相関係数は、これらの危険性を回避しますが、一方、元データを使わず、条件を緩くしているため、結果が出にくくなる可能性があることにも気をつけましょう。

フィッシャーのZ変換

 データが正規分布してようとしてまいとフィッシャーのZ変換を使うと便利です。フィッシャーのZ変換は、いわゆるZ変換とは全くの別物です。私は勝手に同じものだと思い込み、本を読みながらググりながら、頭を抱えてました。フィッシャーのZ変換とは、相関係数を正規分布で近似するために使うもので、いい感じにデータをグニョグニョするとできます。計算式は、
Z_r = 1/2*ln((1+r)/(1-r))
で、rは相関係数を示します。


 少し短いですが、今回はここで終わりです!次のnoteで、ノンパラメトリック検定を用いたpermutation testの話をしていきます!!!



この記事が気に入ったらサポートをしてみませんか?