見出し画像

第60回理学療法士国家試験対策 統計学講義(3)95%信頼区間

 理学療法士を含め、医療系の国家試験には毎年統計学の問題が出題されます。理学療法士では出題数が平均2問(1点問題)で、配点が少ないですが、諦めて対策をしないよりも、ある程度出題範囲が限られているので、対策を講じておきたいところです。
 息子が通っていた養成校の統計学の講義は、いくつかの検定方法を教えるだけで、国試対策としては全く役に立たないものでした。したがって、過去の国試問題を分析して必要な知識を改めて勉強し直す必要がありました。  
 ここでは、問題を解く前に、ある程度知識を整理しておきたいと思います。
 理学療法士の国家試験では、次に挙げる分野で出題されます。

1.ガイドライン
2.研究デザイン
3.95%信頼区間
4.エビデンス
5.検定方法
6.感度・特異度・陽性尤度比
7.統計用語
8. リスク比とオッズ比(補足)

 これらについて、以下、国試に必要な知識を整理していきたいと思います。あくまで国試に必要な知識という事で、統計手法を根本的に理解するという趣旨ではありませんので、ご注意ください。また配点が少ないので、すみずみまで対応しようと勉強するのは、労力vs効果効果が低いです。2問出題された場合、最低1問(できれば2問)得点できるようにしたいものです。

 前回まで、1.ガイドライン、2.研究デザインについて説明してきましたが、今回は95%信頼区間について説明します。95%信頼区間については、あまり聞き慣れないかもしれませんが、最近以下のように国試問題でも出題がみられるようになってきました。
………………………………………………………………………………
ある疾患に対する運動療法の再発予防効果を検討した研究のメタアナリシスを行った。その結果、運動療法を行った群の効果量は0.78(95 %信頼区間:0.66~0.90)であった。これに対する考察で正しいのはどれか。 (第51回 午後 50)
1. 運動療法は生命予後を改善する
2. 運動療法は再発予防効果がある
3. 運動療法は再発危険因子を改善する
4. このメタアナリシスは統計学的に有意でない
5. 運動療法を行った78%の人に再発予防効果がある
……………………………………………………………………………….

 このように、国家試験対策としても95%信頼区間が出題されており、また次に投稿するエビデンスの中でのメタアナライシスに関して、95%信頼区間を理解しておく必要があるので、今回95%信頼区間について、投稿1つを用いて説明します。

【正規分布と危険率5%との関係】
 さて、95%信頼区間の95%って、100%から5%を引いた値です。5%って、統計の世界ではP<0.05というように危険率の基準として聞いた事があると思います。

下図は統計の世界でよく出てくる正規分布の表です。世の中の多くの数値データにはばらつきがありますが、正規分布のような分布をとる事が知られています。

ばらつきの頂点は平均値になります。SDを標準偏差とすると、
-1SDと+1SDの間にデータの68.27%が含まれています。
-2SDと+2SDの間にはデータの95.45%が含まれています。
-3SDと+3SDの間にはデータの99.7%が含まれています。

「-2SDと+2SDの間にはデータの95.45%が含まれています。」というのは、逆に言うと、-2SDと+2SDの外側に外れた値は、合計5% (正確には4.55%)しかないという事を意味します。これは、下図のグラフで言うと、
-2SDより小さい部分の値は全体の2.5%、+2SDより大きい部分の値は全体の2.5%で、それらを足して正規分布の±2SDの外側の数値は全体の5%という事になります。

 もし、何か複数の数値データを調査した場合、平均値より大きく外れた値を取り、±2SDより外側の数値であれば、統計学的に有意に異常な値であるといえます(これがいわゆる危険率p<0.05という意味です)。

【95%信頼区間とは危険率5%の裏返し】
 
前述のように、正規分布の-2SDより小さい部分と+2SDより大きい部分を合わせると、すべてのデータの5%が含まれます。

 逆にいうと、-2SDと+2SDの間の中央部分にはデータの95%が存在する事になります。95%信頼区間とは、正規分布の-2SDから+2SDの範囲を示し、その区間に正規分布を示すデータの95%が入っているのが確実で信頼できるという意味です。

【正規分布の表し方】
・平均値±2×標準偏差
 
いろいろなデータが正規分布を示しますが、それぞれ違う正規分布曲線の違いを表すためにどのように表現したら良いでしょうか?正規分布を表現する方法として、
①山の頂点の値
②山の左右への広がり方(幅がせまいか、広いか)
 の二つで表される事が多いです。

この場合、
①は平均値
②は標準偏差(上記の考え方から全体の95%を含むという意味で、±2SDが良く用いられます)
を用いて、平均値±2標準偏差で表される場合が多いです。

(例)あるグループの身長を調べた時、平均が160cmで、標準偏差が10cmの場合、平均値±2×標準偏差は160±20cmと表現されます。

平均値(95%信頼区間)
 
もう一つの方法として、平均値(95%信頼区間)で表される方法があります。前述のように、95%信頼区間は-2×標準偏差から+2×標準偏差の間を表し、その区間にデータの95%が含まれているので、±2×標準偏差と同じ意味を持ちます。

(例)あるグループの身長を調べた時、平均が160cmで、標準偏差が10cmの場合、平均値(95%信頼区間)は160 (140〜180)cmと表現されます。
この場合、140〜180cmの間にグループの身長データの95%が含まれる事になります。

95%信頼区間をどう使うか
 95%信頼区間の意味がわかった上で、それを実際にどう使うのでしょうか?

 これはほとんどの場合、リスク比やオッズ比の評価として利用されます。リスクの例としてはたとえば死亡率があります。リスク比とは、ある条件A(多くの場合は治療前)と別の条件B(多くの場合は治療後)のリスク(ここでは死亡率)の割合の変化を見ます。

(例)
1.治療前の死亡率が50%として、治療後の死亡率が50%だと、死亡率が治療前後でかわりませんから、リスク比は治療前後で1になります。

2.治療前の死亡率が50%として、治療後の死亡率が40%に改善した場合、40%÷50%=0.8となり、リスク比は0.8となります。このようにリスク比が小さくなるといく事は、治療前後でリスクが小さくなる(危険性が小さくなう=治療効果が良い)ことを意味します。

3.治療前の死亡率が50%として、治療後の死亡率が60%に悪化した場合、60%÷50%=1.2となり、リスク比は1.2となります。このようにリスク比が大きくなるという事は、治療前後でリスクが大きくなる(危険性が大きくなる=治療効果が悪い)事を意味します。

95%信頼区間を用いる場合、ほとんどの場合、率(%)を問題にします。この時、下図のように、中心が1の図を書きます。1いうのは、治療前後で、リスク比に変化がない(1=100%) を表しています。中心に1の線を縦に書いて、横軸には平均と95%信頼区間をプロットします。

上図のように、95%信頼区間が0.4から1.2の範囲にあるとすると、その範囲の中に1が含まれています。これは、この数値データの中に95%の確率で1が含まれている事を意味します。

一方、下図のような場合はどうでしょうか?この場合は95%信頼区間が0.5〜0.9となって、1をまたいでいません。リスク比が1よりも小さい確率が95%になります。リスク比が0.9よりも大きく1になる確率は5%以下で、いわゆるp<0.05 (危険率が5%以下)で、治療前後でリスク比が小さくなっていると結論付けられます。

逆に、下図のような場合はどうでしょうか?この場合も95%信頼区間が1.2〜1.6となって、1をまたいでいません。リスク比が1よりも大きい確率が95%になります。リスク比が1.2よりも小さく1になる確率は5%以下で、いわゆるp<0.05 (危険率が5%以下)で、治療前後でリスク比が大きくなっていると結論付けられます。

このように、95% 信頼区間を見る場合には、その区間が、1をまたいでいるかどうかがポイントになります。
・95%信頼区間が1をまたいでいる・・・・危険率5%で有意差がない
・95%信頼区間が1をまたいでいない・・・危険率5%で有意差がある
という事になります。

では過去に出題された国家試験問題を解いていきましょう。

[1] 2つのバランス練習の効果を比較するため、オッズ比の95%信頼区間を計算したところ、以下の値が得られた。効果が有意であるのはどれか。2つ選べ。 (第49回 午後 49)

1. 0.65~0.89     
2. 0.89~1.39     
3. 0.65~1.39
4. 1.39~5.67     
5. 0.65~5.67

【答え】1と4
 2つのバランス検査の効果に差がない場合はオッズ比は1となります。95%信頼区間が1をまたがないものが統計的に有意な差があるといえます。
 選択肢1の0.65〜0.89は有意にオッズ比が小さくなっています。一方、選択肢4の1.39〜5.67では有意にオッズ比が大きくなっています。

[2] ある疾患に対する運動療法の再発予防効果を検討した研究のメタアナリシスを行った。その結果、運動療法を行った群の効果量は0.78(95 %信頼区間:0.66~0.90)であった。これに対する考察で正しいのはどれか。 (第51回 午後 50)
1. 運動療法は生命予後を改善する
2. 運動療法は再発予防効果がある
3. 運動療法は再発危険因子を改善する
4. このメタアナリシスは統計学的に有意でない
5. 運動療法を行った78%の人に再発予防効果がある

【答え】2
 この問題ではある疾患に対する運動療法の再発予防効果について調べています(メタアナリシスについては別の投稿で説明します)。運動療法を行った群と行わなかった群で効果量を調べたところ、[運動療法ありの効果量]÷[運動療法なしの効果量]が0.78 (95%信頼区間が0.66〜0.90)であったという事です。
 0.78は[運動療法ありの再発予防の効果量]÷[運動療法なしの再発予防の効果量]の平均値になります。1より小さくなっているので、再発予防の効果量が小さくなっています。再発予防の効果量が小さくなっているとすると、「再発しやすい?」と思ってしまいますが、どうやら文脈では、再発予防の効果量とは再発のリスクという意味で使われているようです(ここの文字表現は混乱を招くので不適切です)。「運動療法を行った群の効果量は0.78(95 %信頼区間:0.66~0.90)であった」という表現は「運動療法を行った群の再発のリスクは0.78(95 %信頼区間:0.66~0.90)であった」としなければなりませんね。
 前述のように、通常95%信頼区間を使う場合、リスク比やオッズ比として用いるため、ここでは、再発のリスクが0.78 (78%)に減っているのは良い効果と考えてください。
 そして、95%信頼区間が0.66~0.90と1をまたいでいないので、その傾向(リスク比が78%と小さくなっている傾向)は統計学的に有意な変化であると結論付けられます。

1. 運動療法は生命予後を改善する:× 生命予後を調べている研究ではない
2. 運動療法は再発予防効果がある:○
3. 運動療法は再発危険因子を改善する:×再発危険因子を調べていない
4. このメタアナリシスは統計学的に有意でない:×
 95%信頼区間が1をまたいでいないので、統計学的に有意な変化です。
5. 運動療法を行った78%の人に再発予防効果がある:×
 運動療法を行わない群の再発リスクを100%とすると、運動療法を行う群では再発のリスクが78%に減少したという意味です。いいかえれば、運動療法を行わないと100人の人が再発する状況において、運動療法を実施すれば78人の再発で済むという事で、恩恵を受けるのは100人のうち、22人 (22%)という事になります。
 効果がたった22%だけ?少なくない?と思うかもしれませんが、臨床研究における効果って意外と小さいです。とくに予後に関する改善効果では5%ぐらいがザラで20%の予後の改善は多いぐらいです。

以上、95%信頼区間についての解説でした。



Dr. Sixty_valleyの第60回理学療法士国家試験対策のポータルサイトページは以下です。

この記事が気に入ったらサポートをしてみませんか?