見出し画像

第60回理学療法士国家試験対策 統計学講義(5)検定方法


 理学療法士を含め、医療系の国家試験には毎年統計学の問題が出題されます。理学療法士では出題数が平均2問(1点問題)で、配点が少ないですが、諦めて対策をしないよりも、ある程度出題範囲が限られているので、対策を講じておきたいところです。
 息子が通っていた養成校の統計学の講義は、いくつかの検定方法を教えるだけで、国試対策としては全く役に立たないものでした。したがって、過去の国試問題を分析して必要な知識を改めて勉強し直す必要がありました。  
 ここでは、問題を解く前に、ある程度知識を整理しておきたいと思います。
 理学療法士の国家試験では、次に挙げる分野で出題されます。

1.ガイドライン
2.研究デザイン
3.95%信頼区間
4.エビデンス
5.検定方法
6.感度・特異度・陽性尤度比
7.統計用語
8. リスク比とオッズ比(補足)

 これらについて、以下、国試に必要な知識を整理していきたいと思います。あくまで国試に必要な知識という事で、統計手法を根本的に理解するという趣旨ではありませんので、ご注意ください。また配点が少ないので、すみずみまで対応しようと勉強するのは、労力vs効果効果が低いです。2問出題された場合、最低1問(できれば2問)得点できるようにしたいものです。

 今回は5.検定方法です。検定方法については、国試で頻出問題ですが、内容は深く問われません。「どういった場合、どの検定方法を選ぶか」を問う問題が多いです。したがって国試対策としては最低限、検定方法の名前を覚えるようにしましょう。ただし、検定方法を覚える前に、データを扱う上で、重要な以下の項目について先に説明します。

【重要】
1.パラメトリックデータとノンパラメトリックデータ
2.対応のないデータと対応のあるデータ

【1】パラメトリックデータとノンパラメトリックデータ
 検定方法を覚える上で、パラメトリックデータとノンパラメトリックデータは必ず意識して区別しなければなりません。

パラメトリックデータとは、データが正規分布するデータの事です。代表的なものとして間隔尺度があります。間隔尺度とは、ものさしをイメージしてください。長さや体重、重さなどが間隔尺度にあたります。この場合、間隔に意味があり、たとえば、下のものさしで言うと、1cmに対して2cmは1cmの2倍の長さの意味があり、1cmに対して3cmは1cmに対して3倍の長さの意味があります。このように、間隔(の大きさ)にそのままの意味があるものを間隔尺度といいます。そして、間隔尺度は通常正規分布を示します(パラメトリックデータ。

ノンパラメトリックデータとは、データが正規分布を示さないデータの事です。代表的なものとして順序尺度があります。たとえばMMT(徒手筋力テスト)の段階区分がこれに当たります。
 下表はMMTの段階区分ですが、MMTの段階1と段階2を比べると、段階2は段階1の2倍という意味ではありません。単に、筋力の程度の順序を示しているだけです。同様に段階3は段階1の3倍という意味ではありません。このように、数値と数値との間隔に意味はなく、順序だけに意味がある尺度を順序尺度といいます。

看護Roo! 徒手筋力テスト(Manual Muscle Test;MMT)より引用
https://www.kango-roo.com/learning/3340/

 ちなみに、間隔尺度でパラメトリックデータのように思えるデータでも、正規分布を示さない場合もあります。このような場合、データが正規分布を示すかどうかを先に見極めなければなりません。
 データが正規分布を示すかどうかを検定する検定法をShapiro-Wilk(シャピロウィルク)検定といいます(詳細は国試には不要です)。名前の覚え方ですが、下図のように最初の分岐図の菱形が北海道の形に似ているとしてください。北海道→札幌→札幌ウィーク(週)と関連づけて、シャピロウィークとこじつけで覚えました。

 データが正規分布を示すかどうかを検定する方法には、他に「Kolmogorov-Smirnov(コロモゴロフ-スミルノフ)の正規性の検定」もあります。余裕があれば覚えてください。


【2】対応のないデータと対応のあるデータ
 統計の検定を行う場合、比較する群間で「対応のないデータ」と「対応のあるデータ」では検定方法が異なりますので注意が必要です。 
 「対応のない2群」の例は、下図左のように、「男の身長」と「女の身長」を比べる場合です。「男の身長」の太郎君、ひろし君の身長は、「女の身長」の花子さん、聖子ちゃんの身長とはまったくの無関係です。このように2群の間のそれぞれのデータに一対一対応がない場合を「対応のないデータ」といいます。
 一方、下図右のように、「治療前の握力」と「治療後の握力」を比較した場合、前後のデータは一人の患者のデータで、前後で関連しています。このようなデータを「対応のあるデータ」といいます。

【3】パラメトリックデータの検定(パラメトリック検定)
 以下にパラメトリックデータの検定方法を図に示しました。

上図左は2群の検定です。
対応のある2群では対応のある t 検定 (paired t検定)を用います。
対応のない2群では対応のない t 検定 (unpaired t検定)を用いますが、
さらに対応のない2群で
 データが等分散の場合はStudentのt(スチューデントのt)検定
 データが不等分散の場合はWelchのt検定(ウェルシュのt)検定
を用います。

 一方、上図右は3群以上の検定です。3群以上の検定の場合は、対応のない場合でも、対応のある場合でも分散分析で検定を行います
 分散分析は、3群(以上)を比較し、それぞれの群のバラツキ(分散)に差があるかどうかを検定するものです。検定は3群(以上)の中のどれかに分散の差があるかどうかを検定するもので、どの群がに有意な差があるかを検定してはいません。 
 そのため、分散分析で統計学的に有意な差があった場合、あらためて、、どの群に差があったかどうかを検定する必要があります。これをPost-hocテストといいます。post-とは「〜の後」、hocとは「事」を意味し、post-hocテストとは「事後のテスト」という意味があります。
 Post-hocテストには、有意差の出た群とそれ以外の群を比較するDunntetti法と、すべての群を2群間比較しなおすTurkey法とがあります。

【4】ノンパラメトリックデータの検定(ノンパラメトリック検定)

ノンパラメトリックデータの検定では、すべて検定方法が異なります。
対応のない2群の検定はMann-Whitney U(マンホイットニーのU)テスト
対応のある2群の検定はWilcoxon(ウィルコクソン)の順位和検定

対応のない3群の検定はKruskal-Wallis(クルスカル-ウォリス)テスト
対応にある3群の検定はFriedman(フリードマン)テスト
が用いられます。

【5】2×2分割表の検定
2×2分割表の検定ですが、通常はχ2(カイ2乗)検定を用います。
ただし、枠内の数字のどれかが5以下の場合はFisherの正確確率検定(Fisher's exact test)を用います。
 *Fisherの覚え方は、2×2の枠を釣り堀に見立てて、1枠の魚(Fish)が少ないと考えましょう(釣り堀の魚が少ない場合はFisher)。

なお、2×2以上(下図では3×2)の表の検定の場合もすべて、Fisherの正確確率検定(Fisher's exact test)を用います。

【6】相関関係があるかどうか(国試未出題
2つの要因に相関関係があるかどうかを調べます。要因を一つをX軸・もう一つをY軸にプロットして関係性をみます。相関関係があれば、グラフが直線状になります。下図左のように要因Xが増加するに伴い要因Yが増加する場合は正の相関といい、下図右のように要因Xが増加すると要因Yが減少する場合を負の相関といいます。相関関係の強さは相関係数(r)で示されます。下図中央のように相関関係がまったくない場合は相関係数は0になります。

相関関係を見る場合に、各点にもっとも近似する回帰曲線をコンピュータで計算して作図します。その際に直線から各点への距離の2乗がもっとも小さくなるような直線を描きます。この作図の方法を最小二乗法といいます。

要因Xと要因Yの間に相関関係があるかどうかは、パラメトリックデータの場合Pearson検定を、ノンパラメトリックデータの場合Spearman検定を用いません。相関=ペアー(Pair)と考えると連想できるのではないでしょうか?

【7】生存曲線の検定
 医学論文を見ていると、薬剤などの治療介入を行う研究で、長期間の生存率の違いをグラフにしているものをよく見かけます。
 下の図のような長期間の生存率のグラフ(累積生存率といいます)をKaplan-Meyer(カプラン-マイヤー)曲線といいます。

Kaplan-Meyer曲線で、2群の間に統計学的に有意な差があるかどうかを調べる検定方法はLog-Rankテストといいます。生存時間が長い(Long)から連想すると良いでしょう。

以上、今回は統計学の検定方法についてまとめてみました。



Dr. Sixty_valleyの第60回理学療法士国家試験対策のポータルサイトページは以下です。

この記事が気に入ったらサポートをしてみませんか?