見出し画像

統計的仮説検定入門

1.検定とは・普段無意識に行っている検定

仕事や授業で「検定とは何か」と問えば、よく「t検定とかχ二乗検定とかいろいろあるやつ…」という答えが帰ってくる。
しかしながら、「統計的仮説検定」とはもっと広い概念である。
以下の問題を考えてほしい。

問1
あなたは佐藤くんとコインを使ったゲームをしている。
コインを投げて表が出たら佐藤くんがあなたから、裏が出たらあなたが佐藤くんから1万円をもらえるとしよう。勝負は10回行うとする。
その結果、コインは10回とも表が出て、佐藤くんはあなたから10万円をせしめてしまった。
あなたはおそらく佐藤くんの不正を疑うだろう。なぜだろうか?
以下の問題をときながら一緒に考えていこう。
(1) どういう仮説が真であるとき、「佐藤くんは不正をしていない」と言えるだろうか? キーワード(全て使うとは限らない):母集団・母数・標本
(2) 佐藤くんが不正をしていない場合、表が出る回数はどのような分布に従うだろうか?
(3) (2)の分布において、今回のような事象と同等か、それよりレアな事象が発生する確率を求めよ。
(4) (3)で求めた確率がとても小さい場合、「(1)の仮説は正しいが、今回たまたま超レアなケースを引いた」と考えるより、「(1)の仮定やそれに基づく(2)の分布が間違っていた」と考えるのが自然だ。「小さい」と判断する基準を考えよ。
(5) 今回、(3)の確率は小さいと判断した。その結果あなたは「佐藤くんは不正をしている」と判断するのだ。

2.用語の定義

問1の(1)で設定した仮説を、「帰無仮説」といい、H0と書く。
(2)で求めた分布を、帰無仮説が正しい場合に確率変数が従う分布という意味で、「帰無分布」という。
(3)で求めた、今回観察された事象と同等かそれよりもレアなケースが得られる確率を、「p値」という。
(4)で用いた、p値が小さいか否かを判断する基準となる確率を「有意水準」という。
(5)でやったように、p値が有意水準よりも小さく、帰無仮説が間違っていたと考えることを「帰無仮説を棄却する」といい、帰無仮説の代わりに立てた仮説を「対立仮説」という。

問2
あなたは夜道を歩いていた。向こうから人が歩いてきたが、その人の身長は190cmであった。それを見てあなたは「日本人ではないだろう」と考えた。なぜだろうか?問1を真似て説明せよ。その際、上で定義した用語を用いよ。

問3
問1と同様のゲームをしたとして、今度は7回表が出たとする。
このゲームは公正(コインの表が出る確率は0.5)であると言えるか否かを有意水準5%で検定せよ。

3.検定についてのまとめ

統計的仮説検定の基本的な考えは以上である。
すなわち
(1) 帰無仮説と対立仮説の設定
(2) 帰無分布を求める
(3) p値を求める
(4) p値を有意水準と比較
(5) p値<有意水準の場合、帰無仮説を棄却し、対立仮説を採択する。そうでない場合、帰無仮説は棄却できない。

統計検定の教科書には様々な統計的仮説検定が載っているが、それらはすべて帰無仮説の立て方や帰無分布が異なるだけである。
4節以降では、具体的な検定を学んでいこう。

4.z検定

問4 あるテレビ番組のディレクターは、「日本人の体力測定を行うために、日本の男子大学生から無作為に100人を抽出してスタジオに連れてきた」という。彼らの平均身長は175cmであった。あなたはこの平均身長は高すぎる、すなわちディレクターは無作為と言いつつ実際は恣意的に体格の良い学生を抽出したのではないかと疑った。
日本人男子大学生の身長はND(170cm,5cm^2)に従う。
(1)~(5)の手順を行って、ディレクターが不正をしていると考えるべきか否か判断せよ。

このような検定をz検定という。
標本平均〜ND(帰無仮説でおいた母平均,母分散/サンプルサイズ)であるため、(標本平均-母平均)/√(母分散/サンプルサイズ) 〜標準正規分布(別名z分布)となるからである。左辺の値のことを、z分布に照らして検定を行う値という意味でz検定統計量という。

5.t検定

区間推定の際に、母分散がわからなければ標本不偏分散を用いたことを覚えているだろうか。その際、以下が言えたことを思い出してほしい。
(標本平均-母平均)/√(標本不偏分散/n) 〜t(df=n-1)
今回はこの関係を用いて検定を行う。左辺の値のことを、t分布に照らして検定を行う値という意味でt検定統計量という。

問5 25人の被験者が、あるダイエット法を行った。この25人の体重変化の平均値は−3kgで、不偏標準偏差は2kgだった。
(1)~(5)の手順を行って、このダイエット法が無効であると考えるべきか否か判断せよ。

6.αエラー・βエラー

有意水準5%で検定を行うということは、「帰無仮説が真であったとした場合に今回得られた現象が上位5%未満のレアさなら、帰無仮説を棄却する」ということだ。
したがって、帰無仮説が真であっても帰無仮説を棄却してしまう確率が5%あることになる。
このような誤りのことをαエラー・第一種の過誤・生産者エラーという。

例えば問1の例において、本当はコインの表が出る確率は0.5であったとしても、コインが10回連続で表が出ることは稀ではあるが発生する。
しかし、p値は0.05以下なので、帰無仮説は棄却(イカサマと認定)されてしまう(これは冤罪だ!)。これはαエラーの例である。

また、帰無仮説が本当は間違っているのに、帰無仮説を棄却できない誤りも存在する。これをβエラー・第二種の過誤・消費者エラーという。

問1の例において、本当はコインの表が出る確率は0.7であったとしても、コインが6回表・4回裏となることは発生する。
この際帰無仮説は棄却されない(帰無仮説が正しくてもこのようなことはよく起こるため)。これはβエラーの例である。

αエラー発生率は有意水準と同じ確率である。
では、βエラー発生率はどうだろうか。
これは帰無仮説が正しくない時の分布を知らなければ計算できない。

問6 健康な人の血圧はND(120,7^2)に従うことが知られている。一方で、病気Aの患者の血圧はND(135,4^2)に、病気Bの患者の血圧はND(127,6^2)に従うことが知られている。
佐藤くんの血圧を測り、5%有意水準で健康か否か検定することにする。このとき、佐藤くんが病気Aであった場合にβエラーが発生する確率と、病気Bであった場合にβエラーが発生する確率を求めよ。
また、佐藤くんが病気A・病気Bだった際に正しく病気であると告げられる確率(検出力)をそれぞれ求めよ。

次回に続きます!


謝辞

このnoteはピースオブケイク社での統計勉強会のために作成した資料です。勉強会での講師の機会をくださった参加者のみなさまに感謝申し上げます。

この記事が気に入ったらサポートをしてみませんか?