Mendelian Randomization 勉強日記 11. MRを実施するために
mendelian randomization
methods for causal inference using genetic variants chapter 10.の勉強まとめ
MRのガイドライン (PMID: 32760811, free text available)も参照した
Motivation and scope
MRを実施する前に、研究者はMRを行う動機と目的を明確にしたほうがよい。また、因果関係を明らかにするのか、因果効果の定量まで推定したいのかを明確にする。
例として、教育にかけた時間がアルツハイマー型認知症に影響するかどうか検証したMRでは、因果効果の定量的推定は重要ではなく、両者に因果関係があるのか?という疑問が主であった。このため、優先度は操作変数の妥当性の担保におかれた。しかし、因果効果の推定まで行いたい場合は、想定する介入がwell-definedかどうか、関係は線形かどうか、などさらに検討すべきことが増える。
MRには様々な解析処方があるが、主解析は事前に決めて、ほかの解析手法は感度解析とする方がよい。他の観察研究と同様、いろいろ解析して有意差の出た結果のみを選択的に報告することは避けた方がよい。
データソース
One sample MR: 一つのデータセットで行うため、従来の疫学研究と同様に結果を個人単位で考えられる。
Two sample MR: 二つのデータセットのpopulationが異なることで、操作変数の妥当性を脅かすおそれがある。特に民族や遺伝的祖先が異なり、連鎖不平衡のパターンが異なる場合、バリアント-曝露でみられた関連が、バリアント-アウトカムで用いた集団では全くみられない可能性もある。
individual data: サブグループ解析もできる
summarized data (ほぼTwo sample MRと同義): 大規模な公開されているデータセットを用いる。実現可能性が高く、公開されたデータなので透明性もある。検出力が高い。公開されたデータが曝露やアウトカムの下流の因子を調整していた場合、collider biasが避けられない。
遺伝的バリアントの選択
一つの遺伝子領域…特異度が高い、介入の効果推定 (例: HMGCR遺伝子変異のMR→スタチンの効果推定)につながることがある
複数の遺伝子領域…頑健な感度解析を実施できる、検出力が高い傾向
生物学的アプローチ…生物学的知識に基づいた選択
統計学的アプローチ…GWASで$${p<5×10^-8}$$の関連のあるバリアントを選択する。バリアント同士の関連を'pruning' ('clumping')する
統計学的アプローチのみでバリアントを選択した場合は特に多面的作用 (pleiotropy)の可能性を念頭におく必要がある
データセット
バリアントの選択にもちいるデータセットと、バリアント-要因の関連を調べるデータセットは同じであることが多い。しかし、バリアント-要因で関連が出たバリアントを選択することは"winner's curse"という過大評価につながる。特に統計学的アプローチだけで選ばれた場合、weak instrument biasが増大する。このため、バリアントの選択にもちいるデータセットを別にする"three sample" MRも行われることがある。
要約すると、遺伝的バリアントの選択に唯一絶対の解は存在しない。
バリアントが少ないと検出力が下がる傾向にあり、多すぎると多面的作用 (pleiotropy)が問題となる傾向にある。一般的にはfalse negativeよりfalse positiveとなる方向のバイアスになることが多い。
このため、ガイドラインでは下記が推奨されている。
1.もし生物学的な曝露との関連の裏付けのある遺伝的バリアントがあれば、それだけを用いてMRを行い、適切な感度解析を実施する。
2.もしそのようなバリアントがなければ、最初は選択基準をゆるくしてバリアントを多めにしてMRを行う。推定がnullである場合、因果関係がある可能性は低い。
3.最初の解析で結果がnullではない場合、感度解析を行い頑健性をテストする。(バリアントの選択基準を厳しくする、leave-one-out analysis、robust methods、positive/negative controls、subgroup解析、colocalization)
variant harmonization
例えば正のストランドがAで、負のストランドがTのSNPを考える。
Tをreferenceとして、AのSNPに変異したときの効果を報告しているデータセットもあれば、AをreferenceとしてTに変異したときの効果を報告しているデータセットもある。このようなデータを統合するときにreferenceを統一しておかないと誤った推定値をとりうる。研究者は変異のFrequencyを計算することである程度確認することができる。
また、回文型の変異にはさらに注意が必要である。例えばbiallelic SNPでATが正のストランドとすると、負のストランドはTAとなり同じアレルが出現する。このような場合、allele頻度が50%に近いときアレルが正しく方向づけられていることが証明できない場合は解析から除外する必要がある。
主解析
2 stage method (2SLS, IVW法)が最も効率的な手法であり、主解析として推奨される。その理由はバリアントの選択と同じで、まずはすべての操作変数が妥当であるという仮定のもとで解析を行う。multiplicative random-effects model IVW methodsはheterogeneityを考慮できる。
感度解析での頑健な手法
IVW法より弱い仮定で実施できる頑健な手法を感度解析で実施することを推奨する。e.g. MR Egger, weighted median, mode-method or contamination mixture method
Variant specific causal estimatesの異質性をCochran Q, $${I^2}$$で評価することも推奨する。(詳細は12. で)
Positive control/negative control
をおくことや
Leave-one-out analysis
outlierが与える影響を評価するため、バリアントを1つだけ除外して結果に影響を与えるか評価する
方法もある。
この記事が気に入ったらサポートをしてみませんか?