Mendelian Randomization勉強日記 7. summarized dataを用いた因果効果の推定①IVW法
mendelian randomization
methods for causal inference using genetic variants chapter 4の勉強まとめ
Mendelian Randomizationを”MR”と略します。
Y: アウトカム, Outcome
X: 要因 (暴露), Exposure
U: 交絡因子, Confounder (often unmeasured)
G: 操作変数, 遺伝的バリアント Genetic variant as an instrumental variable
とおきます。
IVW (Inverse-variance weighted)法
操作変数の妥当性を満たす遺伝的バリアントがJ個あるとする。
また、暴露とアウトカムの関係が線形で効果修飾がないと仮定する。
$$
E(X|G_j=g, U=u) = \beta_{X0j} + \beta_{Xj} g + \beta_{XU} u\\
E(Y|G_j=g, U=u) = \beta_{Y0j} + \beta_{Yj} g + \beta_{YU} u\enspace for\: j=1, 2, …, J\\
E(Y|do(X=x), U=u) =\theta_0 + \theta_x + \beta_U u\\
causal\:effect\:parameter\:\theta=\frac{\beta_{Yj}}{\beta_{Xj}} \enspace for\:all\:j=1, 2, …, J
$$
j番目の遺伝的バリアントにおける推定値は
$$
\hat\theta_j=\frac{\hat\beta_{Yj}}{\hat\beta_{Xj}}
$$
標準誤差は
$$
se(\hat\theta_j) = |\frac{se(\hat\beta_{Yj})}{\hat\beta_{Xj}}|
$$
第一項のみを用いているが、GWASデータではGとXの不確実性に比べてGとYの不確実性が大きい場合が多い。
また、最初の式はUの項を含んでいるが、操作変数が妥当であればUとGは独立しているため、Uを調整しなくても結果は同じになる。
複数のバリアントをまとめる場合はどちらが"effect allele"でどちらが"reference allele"であるかを統一しておかねばならない。
IVW meta-analysis
summarized dataでJ個の推定値 $${\theta_1, \theta_2, …, \theta_J}$$ を統合するには?
IVW法の式
$$
\hat\theta_{IVW} = \frac{\sum_j \hat\theta_j se(\hat\theta_j)^{-2}}{\sum_j se(\hat\theta_j)^{-2}}\\
=\frac{\sum_j \hat\beta_{Yj} \hat\beta_{Xj} se(\hat\beta_{Yj})^{-2}}{\sum_j \hat\beta_{Xj}^2 se(\hat\beta_{Yj})^{-2}}
$$
バリアント毎の推定値の重みづけ平均を表す。
IVW推定値の標準誤差は (fixed-effectとして)
$$
se(\hat\theta_{IVW}) =\sqrt{1 \over\sum_j \hat\beta_{Xj}^2 se(\hat\beta_{Yj})^{-2}}
$$
一見複雑にみえるが、足し算、二乗、平方根の組み合わせであり、(解析ソフトを使用せずとも)電卓でも計算できるレベルであるとのこと!!
難しく見えていたMendelian Randomizationも、実際にやっていることは単純であることがわかった
問題はSNPに詳しくなりどのSNPが曝露と関連しているか、ほか、操作変数の妥当性を満たすかをいかに議論するかだろう
この記事が気に入ったらサポートをしてみませんか?