見出し画像

相関と因果:くすんだ相関→明瞭な因果へ

その相関は、単相関であって真の相関ではない
相関であって、因果ではない(鶏が先か、卵が先か)

やめて!もう、その話はやめて!
よく分からないから。
そう、思ってきた。皆さんも、そうではないか?
そろそろ、解決しようと思った。

▶︎用語の定義:相関、因果、関連性

まずは、用語の定義について整理したい。

相関関係:AとBの事柄になんらかの関連性があるもの
因果関係:Aを原因としてBが変動すること
関連性:相関を指すことも、因果を指すこともできる便利なぼやっとした用語

スライド2

Varadyらの報告によれば、400件の整形外科観察研究を調査し、60%の研究で因果関係を示す言葉が誤用されていることが明らかとなった[1]。
論文化された秀逸な研究者たちですら、60%が因果という用語の使い方を間違えているのだ。心してかからねばなるまい。

✅ Related study
1. Varady, Nathan H., et al. JBJS (2021): 10-2106. >>> doi

▶︎くすんだ相関

✅ Keyword:その相関は、単相関であって真の相関ではない

例えば、「歩行速度と握力に関連性があるのではないか?」という研究疑問に対して、測定し、相関係数を算出したとする。
その結果、以下のような結果が出た。

スライド3

この結果の解釈は、「握力は歩行速度と関係している」ではいけない。
なぜなら、「その相関は、単相関であって真の相関ではない」からだ。
そもそも、この結論には、違和感がある。なぜ握力が歩行速度に影響するのだろう・・・。

考えていく。
歩行速度は、年齢と反比例の関連性(年齢↑ほど歩行速度↓)がある [2]。
握力は、年齢と反比例の関連性(年齢↑ほど握力↓)がある [3]。

スライド4

こういうことだ。
「歩行速度は、年齢と関連性があり、年齢は握力と関連性がある」

スライド5

そのため、相関分析において握力と歩行速度に関連性を認めたわけだ。
これが、単相関の罠であり、「くすんだ相関」と呼びたい。
くすんだ相関は、1対1関係で見ていて、それ以外の交絡因子を考慮していない
交絡因子がわからない!!!、という方は以下のnoteを参照してほしい。

✅ Related study
2. Jabbar, Khalid Abdul, et al. Gait & posture (2021). >>> doi
3. Budziareck, et al. Clinical nutrition 27.3 (2008): 357-362. >>> doi

▶︎明瞭な相関①:横断的な対応

✅ Keyword:その相関は、単相関であって真の相関ではない

では、くすんだ相関を明瞭な相関にするためには、何をする必要があるか。
大きく、横断的な対応と縦断的な対応がある。
横断的な対応とは、「種目としての交絡因子の影響を補正する」ということだ。
先ほどの例でいえば、握力と歩行速度の関連性をみたいときに、「年齢」の影響を補正するということだ。

具体的な横断的な対応方法には、以下のようなものがある。

✅ 横断的な交絡因子への対応方法
限定:交絡因子の値が特定の区分あるいは範囲に入る人だけを対象者にすることにより、交絡による影響をある程度排除する。
回帰分析による交絡の補正:重回帰分析などの回帰分析を用いることで、「投入された独立変数」の交絡による影響が補正された関連性が算出される [4,5]

スライド6

以上の対応方法によって、主要なエクスポージャー以外の影響を補正できる。
横断的なくすみが除去された、明瞭な相関を求めることができる。

✅ Related study & book
4. VanderWeele, Tyler J. Eur J Epidemiol. 34.3 (2019): 211-219. >>> doi
5. 新谷歩. 今日から使える医療統計. 回帰分析による交絡の補正 >>> amazon

▶︎明瞭な相関②:縦断的な対応

✅ Keyword:その相関は、単相関であって真の相関ではない

次に、縦断的な対応である。
ちょっとわかりにくいので、具体例から考えてみたい。
ある時点(T1)において、身体活動量(歩数)と下肢筋力の関連性を調査した。
その結果、交絡因子を補正しても関連性が認められたとする。

スライド7

この結果をもって、「明瞭な相関だ」としていいのだろうか?、という話だ。
結論からいえば、十分ではない。
なぜなら、ある因子の影響を考慮できていない、からだ。
それは『時間』だ。

以下の図を見てほしい。

スライド8

身体活動量も下肢筋力も、時間変化する変数だ。
先ほどのタイムポイント(T1)から1ヶ月さかのぼった時点(T0)を見てみる。
この1ヶ月で、下肢筋力は変化がない、一方、身体活動量は爆上がりしている。
この結果をみると、「身体活動量と下肢筋力に明瞭な相関がある」とは言いにくくなるだろう。そうなのである。
時間変化する因子についての相関を把握したい時には、縦断的な影響についても調査し補正する必要がある
具体的な対応方法については、項目のみ列挙する。詳細は参考論文を参照していただきたい(僕もこれから勉強を進めていく)。

✅ 横断的な交絡因子への対応方法 [6]
①治療の逆確率による重み付け;inverse-probability-of-treatment weighting
②パラメトリックG式:parametric G formula
③G推定:G estimation

✅ Related study
6. Mansournia, Mohammad Ali, et al. bmj 359 (2017). >>> doi

▶︎明瞭な因果関係:対照実験

✅ Keyword:相関であって、因果ではない(鶏が先か、卵が先か)

さて、ここまでみてきたことは、「相関を明瞭にする」ということでしかない
つまり、AとBが関係あるかどうかを把握することに尽きていて、あくまでも矢印は双方向性である。
身体活動量が増えるから筋力が増大するのか、筋力が増大するから身体活動量が増えるのか、は定かではない。
この鶏が先か、卵が先か、という問題を明らかにすることは至難の業だ。

1つの方法がある。
それが、「対照実験」である。
たとえば、「AがBの直接的な要因である」を証明するためには、対照実験では以下2つの手続きをする。

①ある処置をしてAが起こるとBが起こる
②ある処置をしてもAが起こらないようにするとBが起こらない

①だけでは、「ある処置」によってBが起こった可能性を否定できない。
②が加わることで、「Aだけを無くすとBが起こらなかった」から「お前かぁ〜〜!!!」となる。
この対照実験を用いた巧みな研究論文 [7]について以前にnoteにしているので参照いただきたい。

だが、これを人間でやることは、容易ではないのだ。
例えば、先ほどの身体活動量と下肢筋力の因果を調査したいとする。
上記に当てはめてみると・・・。

①ドーピングによって下肢筋力を増強したときに身体活動量の増大が起こるか?
②筋の切離やボツリヌス毒素で麻痺を引き起こし下肢筋力が低下したときに身体活動量の低下が起こるか?

そんなこと、できる?
ヒポクラテス、怒りますよ。
だから、難しいのだ。
ほんとうの因果を知るには、相当に秀逸な研究デザインを組む必要があるのだ。
いつの日にか、そんな研究デザインを組んで、ほんとうの因果を突き止めたい。

✅ Related study
7. Biltz, Nicole K., et al. The J of physiol 598.13 (2020): 2669-2683. >>> doi

▶︎相関と因果を考える上で参考になる研究

○●━━━━━━━━━━━・・・‥ ‥ ‥ ‥
臨床研究のつくり方を考え・つくり手を育てる
『僕らの臨床研究の年輪』
こちらから♪
↓↓↓

【あり】最後のイラスト

#理学療法 #臨床研究 #研究 #リハビリテーション #エビデンス #僕らの臨床研究の年輪 #研究方法

‥ ‥ ‥ ‥・・・━━━━━━━━━━━●○