見出し画像

仮説検定とは

仮説検定とは、データに基づいて、ある仮説が正しいかどうかを確率的に判断する統計的な手法です。日常的な疑問を検証するために使ってみましょう。データ抽出とか計算が面倒なのでそれはAIを使えばすぐ答えを出してくれます。

  1. 帰無仮説と対立仮説を立てる: 帰無仮説は「効果がない」「差がない」「変化がない」といった現状維持を主張する仮説、対立仮説は「効果がある」「差がある」「変化がある」といった変化を主張する仮説です。

  2. 有意水準を設定する: 帰無仮説が正しいにもかかわらず、それを棄却してしまう確率(第一種の過誤)の上限を決め、一般的には5%や1%が使われます。

  3. 検定統計量を計算する: データから計算される値で、帰無仮説が正しいと仮定した場合に、その値が得られる確率を評価するために使用されます。

  4. p値を計算する: 検定統計量に基づいて計算される値で、帰無仮説が正しいと仮定した場合に、観測されたデータと同じか、より極端なデータが得られる確率を表します。

  5. 帰無仮説を棄却するかどうかの判断: p値が有意水準より小さい場合、帰無仮説を棄却し、対立仮説を採択します。

例えば、新しいダイエット方法の効果を検証する場合、

  • 帰無仮説:「このダイエット方法に効果はない」

  • 対立仮説:「このダイエット方法に効果はある」

となります。そして、被験者を2つのグループに分け、一方には新しいダイエット方法を実施し、もう一方には従来通りの食事をしてもらいます。一定期間後、体重の変化を測定し、仮説検定を行います。

p値が有意水準より小さければ、「このダイエット方法に効果がある」と判断することができます。

このように、仮説検定は様々な分野で、データに基づいた意思決定を行うために利用されています。

どうやって計算するのか

仮説検定の計算は、以下の手順で行います。

1. 帰無仮説と対立仮説を立てる

まず、検証したい内容を基に、帰無仮説と対立仮説を立てます。

  • 帰無仮説: 現状維持を主張する仮説 (例: 新しい薬に効果はない)

  • 対立仮説: 変化を主張する仮説 (例: 新しい薬に効果はある)

2. 有意水準を設定する

帰無仮説が正しいにもかかわらず、それを棄却してしまう確率 (第一種の過誤) の上限を決めます。一般的には 5% (0.05) や 1% (0.01) が使われます。

3. 検定統計量を計算する

検定統計量は、データから計算される値で、帰無仮説が正しいと仮定した場合に、その値が得られる確率を評価するために使用されます。

検定統計量は、検定の種類やデータの種類によって異なります。

  • t検定: 平均値の差を検定する場合

    • 例:2つのグループの平均身長に差があるか

  • カイ二乗検定: 比率や度数の違いを検定する場合

    • 例:男女で特定の商品の購入率に差があるか

  • 分散分析: 3つ以上のグループの平均値の差を検定する場合

    • 例:異なる3種類の肥料で育てた植物の生育状況に差があるか

4. p値を計算する

p値は、検定統計量に基づいて計算される値で、帰無仮説が正しいと仮定した場合に、観測されたデータと同じか、より極端なデータが得られる確率を表します。

p値は、検定統計量と検定の種類に応じて、AIに任せましょう。

5. 帰無仮説を棄却するかどうかの判断

p値が有意水準より小さい場合、帰無仮説を棄却し、対立仮説を採択します。p値が有意水準より大きい場合は、帰無仮説を棄却できません。

1.t検定

新しい薬Aと既存薬Bの効果を比較する試験を行い、それぞれの薬を服用したグループの血圧を測定したとします。

  1. 帰無仮説: 薬Aと薬Bの血圧降下効果に差はない

  2. 対立仮説: 薬Aと薬Bの血圧降下効果に差がある

  3. 有意水準: 5% (0.05)

  4. 検定統計量: t値を計算します。t値は、2つのグループの平均値の差を、標準誤差で割った値です。

  5. p値: t値と自由度を用いて、t分布表をAIに作らせて計算させます。

  6. 帰無仮説の棄却: p値が0.05より小さければ、帰無仮説を棄却し、「薬Aと薬Bの血圧降下効果に差がある」と結論づけます。

例題: ある高校の1年生男子 (Aグループ) 30人と2年生男子 (Bグループ) 30人の身長を測定し、1年生と2年生で平均身長に差があるかを調べたい。

帰無仮説: 1年生と2年生の平均身長に差はない。 対立仮説: 1年生と2年生の平均身長に差がある。

計算式:

  • t値

    1. t = (x̄₁ - x̄₂) / √(s₁²/n₁ + s₂²/n₂)

  • 自由度

    1. df = n₁ + n₂ - 2

計算手順:

  1. AグループとBグループの平均身長 (x̄₁、x̄₂)、分散 (s₁²、s₂²)、標本数 (n₁、n₂) を求める。

  2. 上記の式に値を代入してt値を計算する。

  3. 自由度を計算する。

  4. t分布表も面倒なのでAI 計算もAIに任せます。

2. カイ二乗検定

例題: あるウェブサイトで、バナー広告Aとバナー広告Bのクリック率に差があるかを調べたい。1000人にバナー広告Aを表示したところ100人がクリックし、1000人にバナー広告Bを表示したところ150人がクリックした。

帰無仮説: バナー広告AとBのクリック率に差はない。 対立仮説: バナー広告AとBのクリック率に差がある。

計算式:

  • カイ二乗値

    1. χ² = Σ (O - E)² / E

計算手順:

  1. 期待度数を計算する。帰無仮説が正しい場合、AとBのクリック率は等しいと仮定されるので、全体のクリック率は (100 + 150) / (1000 + 1000) = 0.125 となる。よって、A、Bそれぞれの期待度数は 1000 × 0.125 = 125 となる。

  2. 観測度数と期待度数を以下の表にまとめる。

  1. 各セルについて (O - E)² / E を計算する。

    • Aのクリック: (100 - 125)² / 125 = 5

    • Aの非クリック: (900 - 875)² / 875 = 0.714

    • Bのクリック: (150 - 125)² / 125 = 5

    • Bの非クリック: (850 - 875)² / 875 = 0.714

  2. 上記4つの値を合計してカイ二乗値を求める。 χ² = 5 + 0.714 + 5 + 0.714 = 11.428

  3. 自由度を求める。自由度は (行数 - 1) × (列数 - 1) で計算する。この場合、(2 - 1) × (2 - 1) = 1 となる。

  4. カイ二乗分布表はAIに作らせて、AIが計算したカイ二乗値と自由度に対応するp値を求める。

その他

  • t検定とカイ二乗検定以外にも、様々な種類の検定が存在します。

  • 検定を行う際は、データの種類や分布、前提条件などを考慮して適切な検定を選択する必要があります。

統計は高校で習ったはず。

いいなと思ったら応援しよう!

Yamato Nagata
いつも記事を読んでいただき、ありがとうございます 何かを感じたり、考えるきっかけになったりしたら、とても嬉しいです。