見出し画像

統計準1級 第28章 分割表 解説

フィッシャーの正確検定は超幾何分布を考える

この検定でのP値は観測された分割表よりも偏った値を各々とる分割表に対する出現確率の総和である

例として下記のような分割表を考える

    効果あり   効果なし
  新薬      6                       1

従来薬       3                       4

2×2の分割表において出現確率を考える際にひとつのセルの値を決めたら全てのセルの値は決まるので、今回は左上のセル(以下$${x_1}$$)に注目する

対象となる$${x_1}$$の値の条件付き分布は列和と行和が固定されていることから超幾何分布となるので、超幾何分布で頻出の袋の玉の例で問題を考えるとわかりやすい

https://yoshida931.hatenablog.com/entry/2018/05/02/191215

列和と行和の合計の差が2なので$${x_1}$$の最小値は2
列和と行和のうち小さい方の値が7なので$${x_1}$$の最大値は7

例として$${x_{1}=3}$$の時どうなるかというと
赤玉7個(行和)と白玉5個(合計-行和)から赤玉3個(対象となるセルの値)白玉6個(列和-対象となるセルの値)取り出せということになる

$$
\frac {{}_{行和} C_{x_i}   ×  {}_{合計-行和} C_{列和-x_i}}{{}_{合計} C_{列和}} \\{}\\ = \frac {{}_{7} C_{3}   ×  {}_{7} C_{6}}{{}_{14} C_{9}}  (合計14個から赤玉3個白玉6個取り出す)\\{}\\= 0.122377…
$$

これを$${{x_1}= {2,3,4,5,6,7}}$$について行う

仮に対立仮説が新薬の方が従来薬よりも効果があるという時は$${{x_1}= {6,7}}$$が対象となるのでその時のP値は

$$
= \frac {{}_{7} C_{6}   ×  {}_{7} C_{1}}{{}_{14} C_{9}}  + \frac {{}_{7} C_{7}   ×  {}_{7} C_{0}}{{}_{14} C_{9}}  \\{}\\= 0.133…
$$

であり有意水準5%で有意でないので新薬と従来薬に差があるとは言えない

※ また行和と列和を逆にしても同じ値が得られるので好みで良い

前向き研究と後ろ向き研究

例えば喫煙者の中からどれくらいガンに罹患するのかを調べる研究デザインを前向き研究と呼ばれる
しかしこの場合はガン患者を観測するのにはサンプルサイズをかなり大きくすることが必要である。
そこで、ガン患者から逆算的に喫煙者の割合を調べる研究デザインの方が有用でこれは後ろ向き研究と呼ばれる
うすうす気づいているかもしれないが後ろ向き研究の値から前向き研究の値を推定するにはベイズの定理を用いる

後ろ向き研究のオッズ比 = 前向き研究のオッズ比

喫煙ありなしを$${A_1  A_2}$$ ガン罹患ありなしを$${B_1  B_2}$$とする
後ろ向き研究におけるオッズ比をベイズの定理を用いて変形していくと

$$
\frac{P(A_1 | B_1)}{P(A_2 | B_1)}  (\frac{P(A_1 | B_2)}{P(A_2 | B_2)})^{-1} \\ {} \\= \frac{P(B_1 | A_1)P(A_1)}{P(B_1)} \frac{P(B_1)}{P(B_1 | A_2)P(A_2)} \frac{P(B_2 | A_2)P(A_2)}{P(B_2)} \frac{P(B_2)}{P(B_2 | A_1)P(A_1)} \\ {} \\ = \frac{P(B_1 | A_1)}{P(B_1 | A_2)}  (\frac{P(B_2 | A_1)}{P(B_2 | A_2)})^{-1}
$$

となるので、前向き研究のオッズ比と一致する

ここで$${P(B_1 | A_1) = \theta_1}$$とすると

$$
\frac{P(B_1 | A_1)}{P(B_1 | A_2)}  (\frac{P(B_2 | A_1)}{P(B_2 | A_2)})^{-1} = \frac{\theta_1 (1- \theta_2)}{\theta_2 (1- \theta_1)}
$$

相対リスク比

$${\theta_i}$$がガン罹患率見たく非常に小さい値の時は近似$${\frac{\theta_i}{1- \theta_i} = \theta_i}$$が使えるので

$$
\frac{\theta_1 (1- \theta_2)}{\theta_2 (1- \theta_1)} =\frac{\theta_1}{\theta_2}
$$

となりこれは相対リスク比と呼ばれる

つまりオッズ比は希少事象の相対リスク推定値として機能する便利なやつ

適合度カイ2乗検定


この記事が気に入ったらサポートをしてみませんか?