産業保健職のための疫学・統計学‐データの分析手法:t検定はやめておこう!3-t検定は産業保健領域では使えない

ここまでの一連の記事で、t検定について解説してきました。この記事では締めくくりとして、t検定が産業保健領域では使えないということを実例を見ながら確認していきます。

状況設定

これまでとは少し例を変えて、二つの教室の生徒の身長に差はあるかという問いを考えてみましょう。

教室Aと教室Bがあったとします。
教室Aと教室Bは高校3年生のクラスだったとします。

この二つの教室でクラスの身長の平均に差があるかを調べたいような場合を考えてみます。

この二つのクラス、それぞれ40人ずつおり、その分布はこのような感じです。点線は、平均値です。

ここで、教室Aの平均値は165以上あり、教室Bは165未満です。
平均値を単純に比較すると、どうも、この二つの教室の生徒の身長には差があるといえそうです。

実際に、t検定をしてみましょう。

t検定の結果、平均値は168.6819と159.2950でだいぶ差があります。実際にt値から計算されたp値は、5%を圧倒的に下回っており、この二つの数字の塊だけを比較してみてあげると「ゆーいさ」があるので、教室Aの生徒と教室Bの生徒の身長は差があるので、平均的に教室Aの方が身長が高いといってもよさそうです・・・

が、よくありません。その理由を解説していきます。

t検定が機能しない場合

ここまで見てきた教室Aと教室Bの身長の差について、ただ数字だけを見ていてもなぜ、これにt検定をしてはいけないかがわかりません。

この身長の数字を、男女で塗分けてみましょう。教室Aと教室Bとの間に、何か差を見出せませんか?そうです。男女の比がAとBで圧倒的に違います。教室Aは男性の学生が多く、教室Bは女性の学生が多い状況です。

男性は女性より一般的には身長が高いです。なので、性別の人数構成を考慮せずに、単純に身長だけで比較すると、まずそうだと思えますでしょうか?(もし思えないのであれば、性別ではなく、小学校1年生の教室の平均身長と、高校3年生の教室の平均身長を比較している状況なども想像してみてください。)

現実世界のデータを触っていると、上のように、比較したいものに影響を与える別の要因が結果に影響を与えることはよく経験します。

疫学的には、これらの別の要因のことを背景因子と言ったりします。二つの対象集団の背景因子の保有状況が違う場合、背景因子を調整したうえで分析しないと、誤った結論を導いてしまいます。

背景因子の調整方法:層別化

背景因子の調整方法はいろいろあります。一番簡単なのが、層別化とよばれる方法で、先ほどの場合は、教室Aの男子と教室Bの男子を比較する。教室Aの女子と教室Bの女子を比較する。など、背景因子毎に集団を切り分けて分分析する方法です。

実際に女性のみを対象にして教室Aと教室Bの生徒の身長でt検定を実施してあげると、あったはずの「ゆーいさ」が消えています。図には描画しませんが、男性のみでやっても有意にはならず、男女混ぜて行ったt検定であれほど強く出ていた差はどうやら男性と女性の比率が違うだけが原因だったようです。

このように背景因子の調整を行わずにt検定の結果をうのみにしてしまうと、恐ろしく間違った施策を実施してしまう可能性があります。今回も、

教室Bの身長が明らかに低い(誤った分析)

地域の生徒の大半が化学工場の近くに住んでいる

化学工場からの化学物質の影響かも!?

等と考えてしまうと悲しい状況になります。

産業保健の状況でも、血圧の数値を背景因子に年齢を含めずに分析してしまって、単に事業場Aで高年齢者が多く、事業場Bで弱年齢層が多いだけなのに、事業場Aは高血圧の人が多いので対策をしましょうなどといった提言をしてしまうと(それはそれで間違ってはいないのかもしれませんが)、実際の状況を見誤ってしまうので注意深く考える必要があると思います。

ただし、この方法はシンプルでわかりやすいのですが、その反面、性別のほかに、親の身長、スポーツをしているか、家庭の収入など、複数の背景因子での調整が必要な場合は層別化するための組み合わせが膨大になるため、必要なデータが足らないといった状況になることもあります。

例えば性別で2通り、親の身長を10分割して10通り、スポーツの有無で2通り、家庭の収入で10通りなど、身長や収入を10分割して区切ったとしても、2×10×2×10=400となり、少なくとも教室A、教室Bにそれぞれ400個ずつのデータがなければすべての層で比較することができません。また、1層でもデータが0個の組み合わせがあれば、比較ができなくなってしまいます。

このように、背景因子が多数ある場合の調整は、別の方法を考える必要があり、それが、重回帰分析と呼ばれる方法です。

背景因子の調整方法:重回帰分析

t検定の記事ですが、最後に重回帰分析と呼ばれる手法について、導入部分を解説して終わりたいと思います。「t検定はやめておこう」シリーズの次は、「重回帰分析で分析しよう」シリーズを公開予定です。

次の図が、実際に重回帰分析を教室Aと教室Bに対して、性別を含めて分析した結果です。

読み方は次のシリーズで解説しますが、注目いただきたいのは、オレンジの枠の数値です。schoolBというのが、教室Aに対して教室Bになることでの身長の差の数値、genderMというのが男性が女性に対してどれくらい身長に差があるかの差の数値です。(本当は係数とよばれるものを推定した値なのですが、現時点では差がこれだけあるというくらいの認識でOKです。)

教室の差は-1.939である一方男性は女性に対して12.413、身長の数値が大きいという分析結果です。さらに、紫の枠を見ていただきたいのですが、ここがt検定でも計算していたp値と呼ばれるものです。

教室の差については、-1.9と教室Bの方が教室Aより少し身長が低い可能性がありますが、p値は5%の優位水準を上回っていることから、有意差がなく、教室の差が身長に及ぼす影響はない(帰無仮説を採択する)方が自然です。

一方、性別はp値がものすごく低く、12.4cm、男女で身長に差があるということは、帰無仮説(差がない)で説明するにしては珍しい事象なので、男女の身長に差がないということを否定することができます。

ということで、教室Aと教室Bの身長差は、背景因子を含めて調整した分析を行うことで、教室の差ではなく、男女の比率が違うという結論としてもよいかと思います。

まとめ

産業保健の設定に戻ると、一つ前の記事では次のような状況でBMIの差をt検定した結果を考えました。

差そのものがだいぶ小さかったので、t検定で有意であっても意味はないという結論にしてもよいと思いますが、この二つの事業場のBMIを比較する場合の背景因子について、どんなものが他に思いつくでしょうか?

少なくとも、年齢や性別での調整は必須でしょうし、運動をしているかどうかに興味があるなら、運動についての調整も必要です。

健康経営や産業保健的な健康施策を考える上では、単に数字を比較するだけのt検定だと、大きく見誤る可能性が高いので、t検定はやめておきましょう!

次からは重回帰分析の考え方の記事を連載します。

あと、もし応援いただけるなら、記事をご購入いただけますと嬉しいです。
(注:有料エリアには大したことは書いていません。そのうち公開するテーマの記事の下書きをおまけとしてつけてあります。テーマは、「産業保健職のデータ分析ソフトはなにが良いか?」です。)

ここから先は

1,023字

¥ 300

期間限定 PayPay支払いすると抽選でお得に!

この記事が気に入ったらサポートをしてみませんか?