仮説検定とは

2024年11月25日 22:49

仮説検定とは、データに基づいて、ある仮説が正しいかどうかを確率的に判断する統計的な手法です。日常的な疑問を検証するために使ってみましょう。データ抽出とか計算が面倒なのでそれはAIを使えばすぐ答えを出してくれます。

帰無仮説と対立仮説を立てる: 帰無仮説は「効果がない」「差がない」「変化がない」といった現状維持を主張する仮説、対立仮説は「効果がある」「差がある」「変化がある」といった変化を主張する仮説です。
有意水準を設定する: 帰無仮説が正しいにもかかわらず、それを棄却してしまう確率（第一種の過誤）の上限を決め、一般的には5%や1%が使われます。
検定統計量を計算する: データから計算される値で、帰無仮説が正しいと仮定した場合に、その値が得られる確率を評価するために使用されます。
p値を計算する: 検定統計量に基づいて計算される値で、帰無仮説が正しいと仮定した場合に、観測されたデータと同じか、より極端なデータが得られる確率を表します。
帰無仮説を棄却するかどうかの判断: p値が有意水準より小さい場合、帰無仮説を棄却し、対立仮説を採択します。

例えば、新しいダイエット方法の効果を検証する場合、

となります。そして、被験者を2つのグループに分け、一方には新しいダイエット方法を実施し、もう一方には従来通りの食事をしてもらいます。一定期間後、体重の変化を測定し、仮説検定を行います。

p値が有意水準より小さければ、「このダイエット方法に効果がある」と判断することができます。

このように、仮説検定は様々な分野で、データに基づいた意思決定を行うために利用されています。

仮説検定の計算は、以下の手順で行います。

1. 帰無仮説と対立仮説を立てる

まず、検証したい内容を基に、帰無仮説と対立仮説を立てます。

2. 有意水準を設定する

帰無仮説が正しいにもかかわらず、それを棄却してしまう確率 (第一種の過誤) の上限を決めます。一般的には 5% (0.05) や 1% (0.01) が使われます。

3. 検定統計量を計算する

検定統計量は、データから計算される値で、帰無仮説が正しいと仮定した場合に、その値が得られる確率を評価するために使用されます。

検定統計量は、検定の種類やデータの種類によって異なります。

4. p値を計算する

p値は、検定統計量に基づいて計算される値で、帰無仮説が正しいと仮定した場合に、観測されたデータと同じか、より極端なデータが得られる確率を表します。

p値は、検定統計量と検定の種類に応じて、AIに任せましょう。

5. 帰無仮説を棄却するかどうかの判断

p値が有意水準より小さい場合、帰無仮説を棄却し、対立仮説を採択します。p値が有意水準より大きい場合は、帰無仮説を棄却できません。

新しい薬Aと既存薬Bの効果を比較する試験を行い、それぞれの薬を服用したグループの血圧を測定したとします。

例題: ある高校の1年生男子 (Aグループ) 30人と2年生男子 (Bグループ) 30人の身長を測定し、1年生と2年生で平均身長に差があるかを調べたい。

帰無仮説: 1年生と2年生の平均身長に差はない。 対立仮説: 1年生と2年生の平均身長に差がある。

計算式:

計算手順:

例題: あるウェブサイトで、バナー広告Aとバナー広告Bのクリック率に差があるかを調べたい。1000人にバナー広告Aを表示したところ100人がクリックし、1000人にバナー広告Bを表示したところ150人がクリックした。

帰無仮説: バナー広告AとBのクリック率に差はない。 対立仮説: バナー広告AとBのクリック率に差がある。

計算式:

計算手順:

期待度数を計算する。帰無仮説が正しい場合、AとBのクリック率は等しいと仮定されるので、全体のクリック率は (100 + 150) / (1000 + 1000) = 0.125 となる。よって、A、Bそれぞれの期待度数は 1000 × 0.125 = 125 となる。
観測度数と期待度数を以下の表にまとめる。

各セルについて (O - E)² / E を計算する。
- Aのクリック: (100 - 125)² / 125 = 5
- Aの非クリック: (900 - 875)² / 875 = 0.714
- Bのクリック: (150 - 125)² / 125 = 5
- Bの非クリック: (850 - 875)² / 875 = 0.714
上記4つの値を合計してカイ二乗値を求める。 χ² = 5 + 0.714 + 5 + 0.714 = 11.428
自由度を求める。自由度は (行数 - 1) × (列数 - 1) で計算する。この場合、(2 - 1) × (2 - 1) = 1 となる。
カイ二乗分布表はAIに作らせて、AIが計算したカイ二乗値と自由度に対応するp値を求める。

その他

統計は高校で習ったはず。

いいなと思ったら応援しよう！

いつも記事を読んでいただき、ありがとうございます何かを感じたり、考えるきっかけになったりしたら、とても嬉しいです。