見出し画像

統計:データ集積 ①正規分布かどうか


医師にとって治療した患者さんのデータを集積して、そのデータを解析することは自分の病院の患者背景とともに課題点を知る契機となり、それを学会や論文発表することで社会に還元することが可能です。

集積したデータをまずすることとして、集積データが正規分布かどうかを調べます。(統計分布の多くは正規分布にあり、正規分布か否かをみます)

なぜなら、その分布の仕方で検定方法が変わるからです。

正規分布:t検定
正規分布ではない:Wilcoxon検定

その分布型で平均値または中央値の選択も変わります。

正規分布:平均値
正規分布ではない:中央値


正規分布かどうかの検定は?
私はSPSSを使用して、

①Kolmogorov-Smirnov の正規性の検定
②数が少ない場合はShapiro-Wilkの検定

を使用しています。


少し話は脱線しますが、医師のデータ集積とデータ解析について蛇足ながら書きたいと思います。
正規分布かどうかの検定ですが、実は私は詳細はわかりません。
医者は検定の仕方は知っていますが、その詳細を知らないことが大半です。
実際に、統計学で使われる数学は難しく、そこは深く入らないほうがいいと思います。ただ、統計の使い方を知っているだけです。わからなければ、大学であれば統計の専門家がいるので質問しにいくかんじでいいのではないかと思います。
難解な理由としては、推定や検定ではサンプルに対してランダムさなどの理想的な状態(正規分布)が仮定されています。
しかし、実臨床においては、サンプルの数が少ない、外れ値、その外れ具合をどう補正するかということが当たり前で、その補正をどうするかという理論は非常に難解です。


この記事が気に入ったらサポートをしてみませんか?