統計検定力

統計検定力(Statistical Power)とは、統計的な仮説検定において、実際に効果が存在する場合にその効果を検出できる確率のことです。つまり、実際に差があるにもかかわらず、それを見逃さずに正しく検出できる確率を指します。検定力が高いということは、誤って「効果がない」と結論づける(第二種の過誤)リスクが低いということです。一般的に、検定力は0.8(または80%)以上を目指すことが推奨されます。
検定力の計算には、以下の要素が関わります。

  1. サンプルサイズ(n):データセットの大きさ。

  2. 効果の大きさ(Effect Size):検出したい効果の大きさ。

  3. α(アルファ):第一種の過誤のリスク(誤って「効果がある」と結論づけるリスク)。一般に5%(0.05)が用いられる。

  4. β(ベータ):第二種の過誤のリスク(誤って「効果がない」と結論づけるリスク)。検定力は1-βで表される。

サンプル問題

ある薬の効果をテストするために実験を行います。この薬が効果があるとする効果の大きさ(Effect Size)を0.5、αを0.05(5%)、検定力を80%(β=0.2)と設定した場合のサンプルサイズを求めます。

計算方法

検定力の計算には複雑な統計学的手法が必要ですが、簡単に求めるためにはソフトウェアやオンラインの計算ツールを利用するのが一般的です。ここでは、具体的な計算式よりも概念を理解していただき、実際の計算は専門のソフトウェア(たとえばG*Power)を使用することをお勧めします。
しかし、一般的な理解のために、効果の大きさ(d)、サンプルサイズ(n)、α、βを用いた基本的な式は次のように表されます。


効果の大きさ(Effect Size)は、研究の結果がどの程度意味があるか、または変数間の関係がどの程度強いかを定量的に表す指標です。この数値は、研究で観察された効果が偶然によるものではなく、実際に意味があるものであることを示すために用いられます。効果の大きさは、単に統計的に有意であるかどうか(p値)を超えた、その効果が実際にどれほどのものかを示すために重要です。

効果の大きさの定義

効果の大きさには様々な計算方法があり、それぞれ異なる研究デザインや目的に適しています。以下に代表的なものを示します:

  • コーエンのd:2つのグループの平均値の差を標準偏差で割ったもの。例えば、実験群と対照群の得点の差です。

  • ピアソンのr:2つの量的変数間の相関係数。

  • オッズ比(Odds Ratio):2つの事象の発生オッズの比率。

  • リスク比(Risk Ratio):2つのグループにおける事象の発生リスクの比率。

具体例としての0.5

「この薬が効果があるとする効果の大きさを0.5」というのは、一般的にコーエンのdを使用した場合の例としてよく使われます。コーエンのdにおいて、0.2を小さい効果、0.5を中くらいの効果、0.8以上を大きい効果とする解釈が一般的です。したがって、0.5という数値は、薬を使用する前後での効果の大きさが「中くらい」であることを示しています。これは、薬を使用したことによる効果(例えば、ある健康指標の改善)が、標準偏差の半分程度であることを意味します。

もし薬を使用する前後での身体のある指標(例えば血圧)について研究を行い、薬を使用する前のグループの平均血圧が120mmHg、標準偏差が15mmHgで、薬を使用した後のグループの平均血圧が125mmHgだったとします。この場合、コーエンのdは以下のように計算されます。



この結果から、効果の大きさは0.33となり、「小さい効果」に分類されます。この数値自体が、パーセンテージで表されるわけではありません。むしろ、効果の「相対的な大きさ」を表しており、この場合は標準偏差に対してどれだけの変化があったかを示しています。


  • Cohen's dは、2群間の平均値の差を検証する際に用いられ、主に1標本t検定や2標本t検定で利用されます。この指標は、効果の大きさが中程度から大きい場合に特に有用です。

  • Cohen's hは、2群間の相関関係の差を検定する場合に適しており、相関検定で用いられます。この指標も、効果の大きさが中程度から大きい場合に適しています。

  • オッズ比は、2群間でのイベント発生確率の差を検定する際に使用され、イベント発生確率が低い場合に特に有用です。

  • リスク比:ある要因が特定のイベントの発生リスクを高める(または低める)程度

  • 部分エタ2乗は、回帰分析における説明変数の影響の割合を評価する場合に用いられます。この指標の使用は、回帰分析のモデルが正しいことを前提としています。

これらの方法を選択する際は、研究の目的や仮説、さらにはデータの性質を十分に考慮することが必要です。また、統計検定力分析を行う際には、効果の大きさの指標を適切に選択し、信頼性の高い研究結果を得るために必要なサンプルサイズの計算にこれらの指標を利用します。

1. Cohen's d:2群間の平均値の差

事例:新しい英語教育プログラムが、生徒の英語成績に与える影響を評価したいとします。研究者は、新しいプログラムを導入したクラス(実験群)と、従来の方法で授業を受けたクラス(対照群)の英語の成績平均値を比較します。

  • 使用場面:実験群と対照群の成績平均値の差を評価することで、新しい教育プログラムの効果の大きさをCohen's dを使って計算します。この指標は、効果の大きさがどれほどのものかを示し、研究の意義を定量的に評価するのに役立ちます。

2. Cohen's h:2群間の相関関係の差

事例:ある健康食品が、人々のストレスレベルと睡眠の質との間にどのような相関関係を示すかを調査します。研究者は、健康食品を摂取したグループと摂取しないグループの、ストレスレベルと睡眠の質との相関係数を計算し比較します。

  • 使用場面:2つの群間での相関係数の差を評価することで、健康食品の摂取がストレスレベルと睡眠の質の関係にどの程度影響を与えるかをCohen's hを使って評価します。

3. オッズ比:2群間のイベント発生確率の差

事例:ある医薬品の服用が、副作用の発生確率にどの程度影響を与えるかを調査します。研究者は、医薬品を服用したグループとプラセボ(偽薬)を服用したグループの、副作用の発生確率を比較します。

  • 使用場面:2つの群間での副作用発生確率の比率(オッズ比)を計算することで、医薬品の安全性や副作用リスクを評価します。

4. 部分エタ2乗:説明変数が従属変数の分散に与える影響の割合

事例:学生の学業成績に対する、勉強時間、睡眠時間、および栄養状態の影響を複数回帰分析を使用して調査します。この分析では、各説明変数(勉強時間、睡眠時間、栄養状態)が学業成績の分散にどれだけ貢献しているかを評価します。

実際にコーエンズのdを計算した結果、その値が中程度から大きい場合に、その結果が有意義であると判断することを意味します。コーエンズのdは、2群間の平均値の差を標準偏差で割った値であり、研究の効果の大きさを測る一つの方法です。この値が大きければ大きいほど、効果の大きさも大きいと考えられます。研究者は通常、データ分析後にコーエンズのdを計算し、得られた値を基に効果の大きさを評価します。
実際に得られたデータからコーエンズのdを計算し、その結果が中程度から大きい場合、その分析結果が特に有意義であると判断されます。

この記事が気に入ったらサポートをしてみませんか?