R言語はじめました-統計の基本的選択


統計学は様々な考え方があるようなので、卒業研究レベルで理解しておくべき基本的事項をまとめていきます。

①→②Aまたは②のB、③のAまたは③のBの順序で実施すれば大きな間違いはないでしょう

①正規性の検討
左のヒストグラムは正規分布に従うが、右は非正規分布のデータである

何故、正規性の検定を行うべきか?
→平均値(オレンジ)をデータとして表記した場合は非正規分布のデータは偏りが生じる。故に、非正規分布は中央値(青)でデータを示さないといけない。また、正規分布(パラメトリック)は平均値と95%信頼区間で、非正規分布(ノンパラメトリック)は中央値と四分位範囲で示すことが一般的である。利用する統計はシャピロ–ウィルク検定またはコルモゴロフスミルノフ検定が主となる

画像1

②2群間での比較検討
対応のある2群の比較検定
※対応のあるとは、同一サンプルにおける時間経過など、同一個体の経時的変化等の検定と定義される。例えば、同一人物で形成されるグループ間における1年前の身長と1年後の身長を比較する際には1年前と1年後との間で対応がある。服薬Aを飲んだ後の血液データにおいて、12時間後の変化を比較する際も対応ある検定を用いる(但し、複数時系列データの場合は2群比較とはならない)

パラメトリック検定    Paired t-test:対応のあるt検定
ノンパラメトリック検定  ウィルコクサン符号付順位検定
対応のない2群の比較検定
正規性を示し、かつ等分散
 パラメトリック検定 Student t-test:スチューデントのt検定
正規性を示すが、等分散でなくても良い
 パラメトリック検定 Welch's t test:ウェルチのt検定
正規分布、等分散は関係ない
 ノンパラメトリック検定 Mann-Whitney's U test:マン・ホイットニ検定

画像2


③3群間以上での比較検討

正規分布かつ等分散の場合:一元配置分散分析→多重比較
尚、結果を分析する前に,理論的な背景などにより,比較する平均値についての仮説がある場合は一元配置分散分析抜きで多重比較を行う。
ある群間に注目する場合は、ANOVAは用いず最初から多重比較検定をすればよい。

一元配置分散分析の役割は・・・

 3群間で統計学的有意差があるか、ないかの違いのみ
 AとBとCの比較をした場合、A、B、Cの組み合わせのどこかに差がある
 つまり、どこに差があるか不明(AとB?、BとC?、AとC?)

→多重比較で後検定を実施する:Bonferoni法、Tukey-kramer法

非正規分布の場合:Kruskal-Wallis test→多重比較
多重比較はSteel-Dwass法、Games-Howel法を利用する

画像3


この記事が気に入ったらサポートをしてみませんか?