仮説検定とは
仮説検定とは、データに基づいて、ある仮説が正しいかどうかを確率的に判断する統計的な手法です。日常的な疑問を検証するために使ってみましょう。データ抽出とか計算が面倒なのでそれはAIを使えばすぐ答えを出してくれます。
帰無仮説と対立仮説を立てる: 帰無仮説は「効果がない」「差がない」「変化がない」といった現状維持を主張する仮説、対立仮説は「効果がある」「差がある」「変化がある」といった変化を主張する仮説です。
有意水準を設定する: 帰無仮説が正しいにもかかわらず、それを棄却してしまう確率(第一種の過誤)の上限を決め、一般的には5%や1%が使われます。
検定統計量を計算する: データから計算される値で、帰無仮説が正しいと仮定した場合に、その値が得られる確率を評価するために使用されます。
p値を計算する: 検定統計量に基づいて計算される値で、帰無仮説が正しいと仮定した場合に、観測されたデータと同じか、より極端なデータが得られる確率を表します。
帰無仮説を棄却するかどうかの判断: p値が有意水準より小さい場合、帰無仮説を棄却し、対立仮説を採択します。
例えば、新しいダイエット方法の効果を検証する場合、
帰無仮説:「このダイエット方法に効果はない」
対立仮説:「このダイエット方法に効果はある」
となります。そして、被験者を2つのグループに分け、一方には新しいダイエット方法を実施し、もう一方には従来通りの食事をしてもらいます。一定期間後、体重の変化を測定し、仮説検定を行います。
p値が有意水準より小さければ、「このダイエット方法に効果がある」と判断することができます。
このように、仮説検定は様々な分野で、データに基づいた意思決定を行うために利用されています。
どうやって計算するのか
仮説検定の計算は、以下の手順で行います。
1. 帰無仮説と対立仮説を立てる
まず、検証したい内容を基に、帰無仮説と対立仮説を立てます。
帰無仮説: 現状維持を主張する仮説 (例: 新しい薬に効果はない)
対立仮説: 変化を主張する仮説 (例: 新しい薬に効果はある)
2. 有意水準を設定する
帰無仮説が正しいにもかかわらず、それを棄却してしまう確率 (第一種の過誤) の上限を決めます。一般的には 5% (0.05) や 1% (0.01) が使われます。
3. 検定統計量を計算する
検定統計量は、データから計算される値で、帰無仮説が正しいと仮定した場合に、その値が得られる確率を評価するために使用されます。
検定統計量は、検定の種類やデータの種類によって異なります。
t検定: 平均値の差を検定する場合
例:2つのグループの平均身長に差があるか
カイ二乗検定: 比率や度数の違いを検定する場合
例:男女で特定の商品の購入率に差があるか
分散分析: 3つ以上のグループの平均値の差を検定する場合
例:異なる3種類の肥料で育てた植物の生育状況に差があるか
4. p値を計算する
p値は、検定統計量に基づいて計算される値で、帰無仮説が正しいと仮定した場合に、観測されたデータと同じか、より極端なデータが得られる確率を表します。
p値は、検定統計量と検定の種類に応じて、AIに任せましょう。
5. 帰無仮説を棄却するかどうかの判断
p値が有意水準より小さい場合、帰無仮説を棄却し、対立仮説を採択します。p値が有意水準より大きい場合は、帰無仮説を棄却できません。
1.t検定
新しい薬Aと既存薬Bの効果を比較する試験を行い、それぞれの薬を服用したグループの血圧を測定したとします。
帰無仮説: 薬Aと薬Bの血圧降下効果に差はない
対立仮説: 薬Aと薬Bの血圧降下効果に差がある
有意水準: 5% (0.05)
検定統計量: t値を計算します。t値は、2つのグループの平均値の差を、標準誤差で割った値です。
p値: t値と自由度を用いて、t分布表をAIに作らせて計算させます。
帰無仮説の棄却: p値が0.05より小さければ、帰無仮説を棄却し、「薬Aと薬Bの血圧降下効果に差がある」と結論づけます。
例題: ある高校の1年生男子 (Aグループ) 30人と2年生男子 (Bグループ) 30人の身長を測定し、1年生と2年生で平均身長に差があるかを調べたい。
帰無仮説: 1年生と2年生の平均身長に差はない。 対立仮説: 1年生と2年生の平均身長に差がある。
計算式:
t値
t = (x̄₁ - x̄₂) / √(s₁²/n₁ + s₂²/n₂)
自由度
df = n₁ + n₂ - 2
計算手順:
AグループとBグループの平均身長 (x̄₁、x̄₂)、分散 (s₁²、s₂²)、標本数 (n₁、n₂) を求める。
上記の式に値を代入してt値を計算する。
自由度を計算する。
t分布表も面倒なのでAI 計算もAIに任せます。
2. カイ二乗検定
例題: あるウェブサイトで、バナー広告Aとバナー広告Bのクリック率に差があるかを調べたい。1000人にバナー広告Aを表示したところ100人がクリックし、1000人にバナー広告Bを表示したところ150人がクリックした。
帰無仮説: バナー広告AとBのクリック率に差はない。 対立仮説: バナー広告AとBのクリック率に差がある。
計算式:
カイ二乗値
χ² = Σ (O - E)² / E
計算手順:
期待度数を計算する。帰無仮説が正しい場合、AとBのクリック率は等しいと仮定されるので、全体のクリック率は (100 + 150) / (1000 + 1000) = 0.125 となる。よって、A、Bそれぞれの期待度数は 1000 × 0.125 = 125 となる。
観測度数と期待度数を以下の表にまとめる。
各セルについて (O - E)² / E を計算する。
Aのクリック: (100 - 125)² / 125 = 5
Aの非クリック: (900 - 875)² / 875 = 0.714
Bのクリック: (150 - 125)² / 125 = 5
Bの非クリック: (850 - 875)² / 875 = 0.714
上記4つの値を合計してカイ二乗値を求める。 χ² = 5 + 0.714 + 5 + 0.714 = 11.428
自由度を求める。自由度は (行数 - 1) × (列数 - 1) で計算する。この場合、(2 - 1) × (2 - 1) = 1 となる。
カイ二乗分布表はAIに作らせて、AIが計算したカイ二乗値と自由度に対応するp値を求める。
その他
t検定とカイ二乗検定以外にも、様々な種類の検定が存在します。
検定を行う際は、データの種類や分布、前提条件などを考慮して適切な検定を選択する必要があります。
統計は高校で習ったはず。