ランダム化比較試験(RCT)、メタ分析、バイアス、妥当性

①RCTについて医師国家試験では?

110B22、112F11、113F8、114E17、115B6などで出題されています。RCTについて過去に出た内容を列挙すると以下の通りです。

・介入研究です。観察研究に比べて交絡因子の影響が小さくなります。
・ランダム割付の目的は背景因子、交絡因子を揃えて比較群間の均質性を向上させるためです。
⇨そのため内的妥当性が高くなります(内的妥当性は後述)
・二重盲検は必須ではありません。
・第3相臨床試験で用いられます。
・プラセボを使うこともあります。
・症例数の設定のために治療効果を推定します。
・Intention to treat〈ITT〉による解析は実際に行った治療ではなく、割り付けに基づいて行われます。
・ランダム化比較試験〈RCT〉の必須要件はどれか⇨エンドポイントの追跡

以上の内容がどういった意味なのかを順を追って説明していきます。以下の説明の中で、☆印は国試出題項目です。

②RCTの手順

(A) エンドポイントの設定

 その研究で何を知りたいかです。抗がん剤治療の比較における全生存率(OS)や降圧剤の比較における虚血性心疾患の罹患率などです。適切なエンドポイントを定めそれを追跡し、そこに有意差があるか否かを発表します。

≪注≫論文を読む際はそのprimary endpointやprimary outcome measureが何かに着目することが重要です。このendpointを示すために研究デザインが組まれます。

画像1
画像2

 一方、primaryでないendpoint/outcomeをsecondary outcomeといいます。それを示すための研究デザインではないのですが、その研究で副次的に示された項目です。
例)既存の治療Aと新規薬剤Bの比較
・知りたいことは寿命が伸びるか(全生存率)⇨これがprimary outcomeで、それを適切に示せるよう研究デザインが組まれます。
・一方、読み手は薬の副作用の有無や程度、治療を断念した割合など様々な情報が知りたいため、そのデータも載せ比較します。これがsecondary outcomeです。

☆ランダム化比較試験〈RCT〉の必須要件はどれか⇨エンドポイントの追跡

(B)  サンプルサイズ設定

 primary endpointを示すために何人の人を使って比較する必要があるかを考えます。参加者数(サンプルサイズ)は大きすぎても小さすぎても不都合です。

(ア) サンプルサイズが大きすぎると…
・効果の弱い治療に多くの人が被験者となる(倫理的にアウト)
・ちょっとの差でも有意差が出てしまう。実際知りたいのは臨床的に意義のあるレベルの差があるかです。
・費用が莫大になる。
といった不都合が生じます。

(イ)サンプルサイズが小さすぎると
・有意差が出にくい

という不都合が生じます。サンプルサイズが少ないばかりに本当に効果があるのかないのかわからないという無駄は避けなければなりません。

例)死亡率が0.1%の疾患Xの治療薬を考える際にサンプルサイズを2000人にして治療薬群とプラセボに1000人ずつ分ける
⇨1000人に1人が死ぬため、おそらく得られるデータは1人死亡するくらいでしょう。これでは新薬で死亡が減らせるかはわかりません。何万人も用意する必要があります(が、用意できるか用意すべきか…)

そこで、適切なサンプルサイズになるよう先行研究をもとに考えていきます。
≪注≫もちろんデザインとして良好な先行研究が必ずしもあるわけではないため、その場合はprimary outcomeに合わせて設定していきます。

 分かりやすい例は薬の治験です。RCTは通常第3相試験で新薬の効果があるのかを比較するために用いられますが、それ以前の安全性や投薬量は第1、2相試験の結果を踏まえて判断されます。

☆症例数の設定のために治療効果を推定します。
☆第3相臨床試験で用いられます。

(C) 標本の抽出と割り付け

 サンプルサイズが決まれば割り付けを行います。新規薬剤の効果を示すという例で話を進めます。

 この研究に参加する対象を定めたinclusion criteriaと 、参加させない対象を定めたexclusion criteriaを決めます。新規薬剤のため、高齢者や小児、妊婦などの安全性が確かでない場合、薬物代謝に関わる他の疾患(肝硬変や腎不全)がある人などは除かれがちです。ただし、あまりにinclusion を狭めすぎたり、exclusionを増やしすぎるとリアルワールドの診療に活かせなくなるため注意が必要です。

 その後、割り付けを行います。新規治療群(介入群)と、既存/プラセボ/経過観察のみなどの群(対照群)です。対照群には既存治療の場合もあれば、プラセボ(偽薬)のこともあります。

 誰をどちらの群に割付けるかはランダムに行います。ランダムに割り付けることで、介入群と対照群にいる人たちの特性(背景因子や交絡因子)が偏らないようにします。
例)片方に男性が90%、もう片方に女性が90%と割り付けしてしまうと、その治療は男性だから効いたのでは?となってしまいます。あくまでも新規薬剤という介入だけの効果はどうなのかが知りたいのです。

 盲検化は情報バイアスをコントロールするために重要です。治療をする医師、受ける患者、統計解析者がどちらの群に属するかを知ることで結果が左右されます。理想は上記の者たちが盲検化されていることが理想ですが、現実的ではない場面もあります。例えば外科手術において、新規の治療Aと既存の治療Bの比較では、術者はどちらか知ったうえで執刀するため盲検化は不可能です。

☆介入研究です。観察研究に比べて交絡因子の影響が小さくなります。
☆プラセボを使うこともあります。
☆ランダム割付の目的は背景因子、交絡因子を揃えて比較群間の均質性を向上させるためです。
⇨そのため内的妥当性が高くなります。
☆二重盲検は必須ではありません。

(D) 統計解析

 データを解析します。その際に、割り付けから外れた(脱落したり別の治療群へ移ったりした)人たちをどう扱うかが問題となります。
 脱落者を最初の割り付け通りのグループに含める解析をintention to treat(ITT)解析と言い、脱落者を除外した解析をper protocol(PP)解析といいます。PP解析では介入の効果を純粋に評価可能な反面、脱落の要因に目を瞑るというデメリットがあります。

☆Intention to treat〈ITT〉による解析は実際に行った治療ではなく、割り付けに基づいて行われます。

≪注≫中間解析について
比較試験では決められた追跡期間よりも前に解析を行い、有意差を結論付けられると分かればその時点で試験を終了します。例えば新規薬剤Aと既存薬Bを比較する際、中間解析で圧倒的にAに比べBが優れているとわかれば、Aの群の患者に不利益が生じるため即刻中止しBに割り付けする必要があるわけです。

③バイアスについて医師国家試験では?

115E17で直接問われていますが、それ以前にも小出しで選択肢に含まれています。

・偶然誤差は症例数を増やすことで防止できる
・選択バイアスは対象者の選択方法から生じる
・メタアナリシスでは出版バイアス(治療成績の良いものだけが掲載されるため、複数の研究を持ってきてもポジティブなデータのみに偏る)が問題となる
・情報バイアスは対象者から情報を得る際に生じる
・想起バイアスは症例対照研究で生じうる
・コホート研究よりも症例対象研究バイアスが生じやすい理由は⇨要因の情報を記憶に頼ることが多いため
・二重盲検は情報バイアスを防止の手段である。
・交絡因子は原因と結果の両方に関連する
・研究デザインによって交絡因子は調整できる
・統計解析によって調整できるのは交絡因子。選択/情報バイアスは調整できない。

④バイアス

・真実と研究の結果との乖離を誤差(error)と言います。
・誤差は偶然誤差と系統誤差に分けられます。後者のことをバイアスと言います。
n数を増やすことで偶然誤差の影響を減らすことができますが、n数を増やしすぎることは倫理的問題をはらんでいます(例:効かない薬剤を大量のnに投与するなど)。

☆偶然誤差は症例数を増やすことで防止できる


・バイアスは選択バイアス、情報バイアス、交絡に分けられます。

(A) 選択バイアス(selection bias)
・研究の対象者を選ぶ段階で生じるバイアスです。
1)Twitterでアンケートを取った
⇨回答者はTwitterをやっている人だけに限られ、ネットを使わない人は対象外
2)Berkson‘s bias:病院内の患者のみを対象として選択すると、一般集団に曝露が異なる
例3)メタアナリシスで、ピックアップする研究は出版されているもの=治療効果があったものの割合が高いため、結果としてポジティブなデータが不均等に集まりうる。これを出版バイアスと言います。
・選択バイアスを減らすためには適切なランダム化が必要です。
・後述の交絡に関与しますが、研究の場合は脱落者の存在も注意が必要です。脱落者バイアス(attribution bias)と言います。
例)A群では60%の人が何らかの理由で治療中止
⇨残った40%の人はB群の治療に比べ予後良好だった
⇨A群はB群より本当に予後良好?
⇨いいえ、40%の人が予後良好になる背景(薬の副作用に耐えられる全身状態だったなど)があったのかも。
脱落者も含めたITT解析で評価が必要です。

☆選択バイアスは対象者の選択方法から生じる
☆メタアナリシスでは出版バイアス(治療成績の良いものだけが掲載されるため、複数の研究を持ってきてもポジティブなデータのみに偏る)が問題となる

(B) 情報バイアス
・想起バイアスや測定バイアスなど、研究の情報の真偽に関わるバイアスです。
)症例対照研究にて、疾患ありの群では過去の曝露を思い出しやすいが、疾患なしの群では過去の曝露は思い出しにくい(想起バイアス)
情報の得方を正確に行う工夫が必要です(二重盲検はそのための手段の1つです)
)介入群に入ってると言われた患者は、非介入群に入っていると言われた患者よりも治療に前向きになる(ホーソン効果)

☆情報バイアスは対象者から情報を得る際に生じる
☆想起バイアスは症例対照研究で生じうる
☆コホート研究よりも症例対象研究バイアスが生じやすい理由は
⇨要因の情報を記憶に頼ることが多いため
☆二重盲検は情報バイアスを防止の手段である。

(C) 交絡(confounding bias)
・曝露と結果の両方に関与するファクター(交絡因子)のために、原因と結果が歪んで生じるバイアスです。
1)酒を多く飲む人(原因) に対して 肺癌の罹患(結果)を考える場合、酒を多く飲む人には喫煙者が多い(交絡因子)ため、直接酒と肺癌の間に因果関係がなくとも、「酒を多く飲む人ほど肺癌に罹患しやすい」という傾向が生じます。
2)新規治療を受けている人では予後が悪かった
⇨重症度の高い人ほど新規治療を受けていた。
⇨新規治療(曝露)と予後(結果)の間には重症度という交絡因子があった
ランダム化することで群間の背景を均一にすることができます
例)併存疾患Aの有無に関わらずランダム化
⇨両群に同じだけAを併存している人が参加
⇨Aが交絡因子であっても、その影響が両群の差に大きく影響しない
・ランダム化出来ないケースなどでは、多変量解析分析(重回帰分析やロジスティック回帰分析やCox比例ハザードモデル)や傾向スコア分析などが行われます。

☆交絡因子は原因と結果の両方に関連する
☆研究デザインによって交絡因子は調整できる
☆統計解析によって調整できるのは交絡因子。選択/情報バイアスは調整できない。

⑤妥当性(validity)と信頼性(reliability)

・平均すると正しい値になることを妥当性あり、結果に一貫性があることを信頼性ありといいます。
・妥当性あり=バイアスが少ない 信頼性あり=ノイズが少ない(一貫性がある)

画像3

License: CC BY-NC-SA 4.0

・妥当性には内/外的妥当性(internal/external validity)があります(他にもあるが割愛)
・外的妥当性(external validity)=サンプルの性質(人口、地域、介入、時代など)が異なっても妥当であるか。
⇨その結果を実際の集団、患者に適応できるか
⇨抽出が無作為に行われているか
・内的妥当性(internal validity)=その研究の中身が妥当であるか(バイアスや偶然誤差が制御されているか)。

です。RCTではランダム化し、対照を均一にして同じ条件で比較するため内的妥当性が高い(バイアスが少ない)とされます。

⑥メタ分析

複数の研究から同じ疫学指標を抽出し、それをまとめた指標を算出します
⇨各研究に重みをつけ、同一指標で評価するため妥当性が高くエビデンスレベルも高いです。
・抽出する研究は出版後の研究です。ゆえに、ポジティブデータが集中する(有意差のあるものは雑誌に載り、有意差のないものは載らない)傾向にあります。これを出版バイアスと言います。

115F3
メタ分析〈メタアナリシス〉について正しいのはどれか。
a 異なる指標を統合することができる。
b 指標を統合することで標準誤差は大きくなる。
c 研究から抽出した指標を用いて統合指標を算出する。
d できるだけ多くの研究を選択して出版バイアスを防止する。
e 対象者をプールすることでデータを統合して再解析する研究である。

正解はcです。
a:統合するのは同一指標です。
b:統合するとn数が増え全体の傾向は一致するため標準偏差は小さくなります。
d:n数を増やしても出版バイアスは防止できません。防止のためにはfunnel plotを用います。
e:プール解析のことです。データ単位でまとめるのではなく、研究単位でまとめます。

111E36
メタ分析〈メタアナリシス〉について正しいのはどれか。2つ選べ。
a 生態学的研究の一つである。
b 観察研究は対象にならない。
c 研究を収集することで精度を向上させることを目的としている。
d 複数の研究のすべての個人データをプールし、疫学指標を再計算する。
e 複数の研究から同じ疫学指標を抽出し,それをまとめた指標を算出する。

正解はceです。
a:生態学的研究は国や地域を単位とする研究のことです。
b:対象になります。
d:全ての個人データではありません。研究内容に合致したもののみを抽出します。研究のセッティングが異なるものやアウトカムが別のものは除外します。


この記事が気に入ったらサポートをしてみませんか?