直接効果の推定における誤り

Stephen R Cole , Miguel A Hernán : Fallibility in Estimating Direct Effects. Int J Epidemiol. 2002 Feb;31(1):163-5. PMID: 11914315

 疫学者は、多くの場合で曝露がエンドポイントに影響を及ぼす可能性のある経路を特定しようとする。曝露Eから測定された中間因子Mを経てエンドポイントDに至る潜在的な経路を調べるために用いられる標準的な方法の1つは、EとDの間の影響の尺度をMによって層別化することである。推定された中間因子を調整した後の残差関連は、中間因子によってマークされた経路以外の経路を介した、終末点への曝露の直接的な影響として解釈される

 Robins、Greenlandに倣って、Mを制御したDに対するEの直接効果を、母集団のすべての人のM値が物理的に所定の値に設定されているときのDに対するEの因果効果と定義する。したがって、Mのレベルと同じくらい多くの直接効果があるので、一般的にはDに対するEの直接効果を複数形で呼ぶことになる。 ロビンズとグリーンランドは、上記の標準的な方法では、一般的に曝露の直接影響の偏りのない推定値が得られないことを実証した。 PooleとKaufmanは、仮定の例を用いて、この標準的な方法の不適当性をさらに実証した。以下では、DAGと、医師の健康調査のデータに2つの仮説変数を追加した例を用いて、この問題を再検討する。

 Physicians' Health Study(PHS)は、米国の男性医師22071人を対象に、心血管疾患とがんの一次予防のためにアスピリンとβ-カロチンを投与した無作為化二重盲検2×2因子プラセボ対照試験であった。

 PHSのアスピリン投与は1988年1月に平均5年間の追跡調査の後に中止されたが、これは主にアスピリン投与群でプラセボ投与群と比較して心筋梗塞(MI)のリスクが44%減少したためである。

 E = 1をアスピリンへの無作為化割り付けE = 0をプラセボへの無作為化割り付けとする。同様に、D = 1は、定義された追跡期間中の心筋梗塞(MI)の診断を表し、追跡開始時にはすべての被験者にそのような診断がなかったとする。M = 1は、アスピリン投与後、心筋梗塞の診断がつく前に、誤差なく測定された高血小板凝集の仮説的指標を表す。簡単にするために、M は終始二項変数であると仮定する。

 我々の目標は、すべての人が血小板凝集レベルが低く保たれるように治療を受けた場合と、血小板凝集レベルが高く保たれるように治療を受けた場合のアスピリンのMIに対する直接的効果を推定することである。

 直接効果の明確な定義には、血小板凝集レベルが物理的に設定される方法を詳細に指定する必要があることに注意する。簡単にするために、このような方法が存在し、一般的に受け入れられていると仮定するが、この問題は専門分野の専門家の間で議論する必要があるであろう。

 研究結果の粗リスク比RREDは0.6であり、この場合、原則としてアスピリン曝露がMIのリスクを減少させることを示す因果関係の解釈が可能である。今ここで、2人の研究者がいて、そのうちの1人が、アスピリン曝露の効果は血小板凝集の減少のみによってエンドポイントを引き起こす(すなわち、Dに対するEの直接的な効果はない)と仮説を立てたとする。有向非周期グラフを用いてこの仮説を描くことができる。

画像1

グラフ(1)が自然界の真の状態を表しているとすると、Mの標準的な調整(層別化または回帰)を行うと、EからDへの経路は残されず(すなわち、EはMの層内ではDの原因にはならない)、したがって、層別リスク比RRED|M=m(m = 0, 1)とマンテル-ハエンスツェル要約リスク比RRED|Mは1になるであろう。

 2人目の研究者は、アスピリンの使用が直接血小板凝集に影響を与えることに同意しているが、MIのリスクに対するアスピリンの影響は、血小板凝集(M)によって媒介されない他の未決定の経路を通っていると仮説を立て、別のグラフを提案している。

画像2

 グラフ(2)では、Mを調整しても粗リスク比RREDは変化しない。もちろん、アスピリンの効果が血小板凝集を介して媒介され、(おそらく抗炎症作用を介して媒介されている)直接的な効果が残存するような、より複雑な別世界の仮説を立てることも可能である。Mantel-Haenszel RRED|M = 0.6の部分的に仮説的なデータは、明らかに2番目の研究者の仮説を支持している。このRRのナイーブな解釈は、Mを調整した後にEがDに直接的な保護を与えるという結論を導く可能性がある。

両者が知らない真の因果関係グラフは

画像3

 ここでU = 1は、別の経路で血小板凝集の増加とMIのリスクの減少を同時に引き起こす仮説的ではあるが未知の遺伝子型を表している。

 グラフ(3)は最初の研究者の仮説と一致しているが、彼はUの存在を考慮していないことに注意されたい。遺伝子型Uや他のランダム化前の変数は、ランダム化によるアスピリン投与とは関連していない

 因果関係グラフ(3)をざっと見ただけでは、RRED|Mが0.6ではなく1になるような印象を受けるかもしれない。しかし、DAGの理論を用いて、(1)EがMを予測し、(2)Dに対するMの因果効果がUによって交絡されるため、Mで層別化するとEとDの間に偽の(因果関係のない)関連が生じることを示すことができる。

 直感的な理解は以下から得られるだろう。まず、血小板凝集が高い人(M = 1)で、アスピリンに無作為に割り付けられた人は、素因遺伝子型Uを保有している可能性が高い(高血小板凝集の原因がアスピリンの不在によるものであることはありえないため)。同様に、血小板凝集が低い人(M = 0)で、プラセボに無作為に割り付けられた人は、遺伝子型Uを持たない可能性が高い。このように、Mの両層において、UとEの間には正の相関がある(RRUEU|M=m = 0, 1の場合はm > 1)。

 第二に、UはDと逆に関連している(RRUD|M=m = 0, 1の場合は0.1)。これらの2つの条件と交絡の方向性を理解すると、一般的にMを条件付けした後では、EとDの間の逆相関が予想される。この擬似相関の大きさは、測定されていない遺伝子型と血小板凝集との関連、および遺伝子型とMIとの関連に依存し、この例では比較的強かった(RRUM = 2.7およびRRUD = 0.2)。

 我々の例が示すように、EがDに直接影響を及ぼさない場合でも、この擬似相関が現れる可能性がある。我々は、A と B の共通の原因が存在する場合、曝露 A の結果 B への因果関係について交絡絡が存在すると考える。

 要約すると、(a) M の D への影響に対する交絡があり(例えば、それらの共通原因 U に起因する)、(b) E が M を予測する場合はいつでも、E と D の間に擬似相関が生じると予想される。これは部分的に仮定の例なので、UとMの両方で層別化することができ、Mantel-Haenszel RRED|UM = 1.0を得ることができる。因果関係グラフ(3)の下では、RRED|UMは、UとMの両方のレベル内でのDに対するEの直接効果として単純な因果関係の解釈ができる。

 もし直接効果がUとMで定義された4つの層にまたがって変化していたら、4つの直接効果を別々に提示することになるだろう。あるいは、(U と M のレベルにプールすることで)平均的な因果直接効果を計算したいと思うかもしれない。

 U を測定することが難しい、または不可能な場合、U と M の間(または U と D の間)の因果経路にある測定された変数 C で層別化することで、疑似相関を除去することができる

画像4

 グラフ(4)から生成されたデータにおいて、U と C のどちらかで層別化することで、M の D への影響の交絡が解消されることに注意。

画像5

 その場合、標準的な方法(層別化や回帰)では、バイアスのない直接効果を推定することはできない。したがって、UまたはCのいずれかが暴露Eの影響を受ける場合には、Robinsのノンパラメトリック(g-formula)またはセミパラメトリック(直接効果の入れ子構造モデル、限界構造モデル)の因果推定法など、直接効果推定のためのより一般的な分析的枠組みが必要となる。UまたはCのいずれかが測定され、モデルの仕様ミスがない限り、これらの方法は、Mを制御するDに対するEの直接効果として因果的に解釈できる推定値を提供する。

 直接効果を推定するには、曝露と中間変数の両方が結果に及ぼす影響について、測定されていない交絡因子が存在しないことが必要である。これらの条件が両方とも満たされない場合、どの方法も曝露の直接効果の偏りのない推定値を提供することはできない。しかし、残念ながら、測定されていない交絡因子がないというこれらの仮定は、観察されたデータからは検証できない。

 我々が提示したDAGは、しばしば複雑な世界を過度に単純化したものである。しかし、このような単純な世界で直接効果を正しく推定するために必要な仮定を理解することは、より現実的なシナリオに向けて拡張するための必須条件である。

 曝露の直接影響を推定したいと考えている実践的な疫学者への推奨事項は3つある。第一に、研究計画の段階で、曝露と結果の関連性と同様に、中間因子と結果の関連性についても潜在的な交絡因子を収集する。第二に、研究分析の段階では、交絡因子の両方の経路を正しく制御する試みとして、これらの追加変数を(必要に応じて、標準的な方法または因果法を用いて)組み入れる。特に、曝露の影響を受ける変数を調整する必要がある場合には、一般的に因果法が必要とされる。第三に、研究結果を伝える際には、結果に対する媒介者の因果関係について、測定されていない交絡因子が存在しないという追加の仮定を明示し、検討する。

この記事が気に入ったらサポートをしてみませんか?