産業保健職のための疫学・統計学‐データの分析手法:t検定はやめておこう!2‐t分布とt検定

一つ目の記事では分布と正規分布の話をしました。ここからはt分布を利用したt検定について考えていきます。

それでは始めましょう。

t検定の導入

状況設定

さて、もともとt検定は二つの畑の作物の収穫量に差があるかという質問に答えるために考え出された手法です(注1)。産業保健職として二つの集団の平均を比べたい(どちらの集団の方が平均値が多いか)という状況は多々あるので、学会発表でもたまに利用されているのを見ます。しかし、産業保健の調査研究の文脈で利用できる場合は相当限られているので、t検定は利用しないことをおすすめします。ただし、その考え方を知っておくのは、別の記事で解説する重回帰分析やロジスティック回帰分析などの考え方で役に立つので、ここでt検定について理解をしていってください。

さて、状況設定です。次の図のように、二つの事業場のどちらの従業員の方がより体重が大きいか(BMIが高い数値であるか)を調べたいとしましょう。

あなたならどのようにしますか?単純な比較としてよく行われるのが、A事業場の従業員全員のBMIの平均値と、B事業場の従業員全員のBMIの平均値をとってきて、比較することかもしれません。しかし、どれくらいの差がついていれば、Aの方がBより(あるいはBがAより)BMIの平均が大きいといえるでしょうか?

事業場Aの平均BMIが23.2で、Bの平均BMIが28.8だったとき、0.4の差でAの方が大きいといえますか?0.2だったら?0.1だったらどうでしょうか?

この差が生じる可能性がどれくらいあるのかを考えるのが検定という手法です。

t検定の結果

さて、とりあえずここでは、二つの事業場AとBの従業員全員のBMIがわかっているとして、事業場Aの従業員と事業場Bの従業員のBMIの平均値に差があるかを実際にR言語を利用してt検定を行った結果をみてみましょう。

英語の羅列でなにが書いてあるか、さっぱりわからないと思いますが、一つ一つ見ていきます。ただ、その前にt検定というものが何をしているか、大枠を理解して結果をみていくことにしましょう。

t検定の考え方

t検定の考え方の大枠は、次の4つのステップです。

  1. 二つの分布に差がないという仮定を置く(帰無仮説を設定する)

  2. 二つの分布の平均値の差からt分布を利用してt値を計算する

  3. 二つの分布の平均値に差がない場合の確率をt分布を利用して計算する

  4. 計算した確率が・・・

    1. 低ければ、差がないという1.の仮定が間違いなので、「差がないということが間違い」と結論付ける。

    2. 高ければ、差がないという1.の仮定は十分に起こりえるので、「差がないということが起こった」と結論付ける

ものすごくややこしいですが、何とか理解してください。差があるといいたいがために、差がないという仮説をたてて(1.)その仮定が起こる確率を計算して(2,3)、それを否定する(4.)という回りくどさです。差がないを否定することで、間接的に差がある(かもしれない)ということを主張する形です。

図でもみておきましょう

この図でもやっぱりややこしいと思うのですが、一つ一つステップをみていきましょう。

t検定の実際

それでは、一つ一つみていきます。まず状況設定を改めて思い起こしてもらうと、二つの事業場の従業員のBMIに差はあるかを知りたいという状況でした。この状況に対してt検定を実施していきましょう。

ステップ1:帰無仮説の設定

まずは帰無仮説の設定です。ここでの帰無仮説とは、

事業場Aの従業員の平均BMI と 事業場Bの従業員の平均BMI に差はない

というものになります。これはそれほど難しくないですね?

ステップ2&3:t分布を利用して帰無仮説が起こる確率を計算する

次にt分布を利用して帰無仮説の起こる確率を計算するというステップです。このステップ、統計ソフトを利用すれば、基本的に自分でやる必要は全くないので、この記事では詳細を解説しません。R言語でのt検定の実施結果をみてみましょう

薄い緑の部分がAとBの平均値です。今回のだと、A事業場の平均BMIは20.15で、B事業場の平均BMIは21.04となっています。B事業場の方が0.89、平均してBMIが大きいという結果です。

次に、黄色でハイライトした部分をみてください。t=-9.6545となっています。これがt値とよばれるもので、このt値から計算された、帰無仮説が正しい場合に、今回の結果が得られる確率、p値が、<2.2e-16と記載されています。これは、確率が0.00000000000000022であることを表しています。ほぼ0ですね。

ステップ4:帰無仮説を棄却するか採択するかを決める

もし、帰無仮説、事業場AのBMI平均値と事業場BのBMI平均値が等しいという仮説が正しい場合に、今回の事業場Aの平均値が20.15で、事業場Bの平均値が21.04となる可能性は、ほぼ0に近い可能性であるという解釈になります。

ということは、帰無仮説、二つの事業場の平均値が等しい場合に、今回実際に手元にあるデータがでてくる確率はものすごく珍しいということになるため、帰無仮説を棄却して、有意差がある結果である!と主張することができます。(逆に、一般的な医学系の調査研究であれば、このp値が5%以上、0.05以上であれば、有意差はなく、帰無仮説通りに、そんなに珍しくないデータが手元で観察されたと考えます)

いかがでしょうか?t検定の枠組み、なんとなく理解できたでしょうか?

結論

ここまでの結果から、A事業場とB事業場、BMIの平均値はt検定で、統計的には有意な結果になりました。なので、AとB事業場のBMIは「ゆーいさ」があるので科学的にもB事業場の人が大きいことが証明された!産業保健職としてどんどん対策を・・・

打たない方がよいです。

この記事のタイトルを思い出して下さい。「t検定はやめておこう」という副題を入れています。実は、今回のt検定の結果でp値だけを見て議論をすすめることは大きな問題があります。

有意差があってもダメな理由1:差の大きさ

再度結果を見ていただきたいのですが、A事業場とB事業場のBMIの平均値、実際の差を見ていただくと、たった0.9くらいの差です。1のBMIは大きいといえば大きいですが、肥満など、問題がある人はA事業場、B事業場にそれぞれそれなりにいそうです。

集団として差を認めたとしてもその大きさが3とか4とか、実務的な感覚で問題があるのであれば、問題であるとしてもよいかもしれませんが。今回の差はどこまで大きいとしてよいでしょうか?

p値で5%を切ったか切っていないかだけを意識してしまうと、実際の差がそれほど大きくないのに、片方だけ大きいというように考えてしまいがちなので注意が必要です。

また、t検定のカラクリとして、対象となる人数が大きければ、差が0.01しかなかったとしても有意になります。数千人の企業同士をt検定などで比較すると、ほとんど意味のない検定の結果となること、認識できておいたほうがよいと思います。

有意差があってもダメな理由2:そもそも状況設定が不適切

こちらの方もだいぶ申告なのですが、これがそもそもの記事のタイトルにつながる話なので、別の記事で解説できればと思います。

まとめ

この記事ではt検定の枠組みについて解説を行いました。次の記事では、t検定が産業保健の設定では役に立たない理由を解説していきます。

ここまで読んでいただいて、ありがとうございました。


注1:ギネスブックや黒ビールで有名なギネス社の醸造家、ゴセットが見出したのがt分布です。ギネス社は社員の研究発表をあまり快く思っていなかったらしく、ゴセットはスチューデントというペンネームで一連の研究を発表しました。t検定、Studentのt検定と呼ばれることがあるのは、ゴセットが利用したペンネームに由来します。

この記事が気に入ったらサポートをしてみませんか?