見出し画像

RCTをベイズの考え方を使って解釈する

最近更新が疎かでしたが、FF16に余暇を使ってたので仕方ないです。


RCTの結果をベイズの考え方で解釈するという論文

今回のTXP勉強会は沖縄県立中部病院腎臓内科の耒田先生の発表。RCTの結果をベイズの考え方で解釈するという論文がNEJM EvidやJAMA系列からちょいちょい出ています。

ベイズの問題は「大事そうだからやろうと思っているけど、頻度論で論文が書けてしまうので結局勉強しない」点にあると思いま…え、僕だけですかね?

僕はベイズに関しては全然理解できていません。ちなみにリサーチチームのH先生は、どう解釈したいかにもよるけど、サンプルサイズが十分にあるなら頻度論でいいんじゃない、的なコメントされていました。

耒田先生はHarvard CollegeのStat 102(Introduction to Bayesian)の授業に参加されたそうですが、これらの論文はそのコースのイントロダクションレベルの内容なので、考えながら手を動かすのがいいよという話(耒田先生だからでは…みたいな気もしますが)。

ちなみに上記JAMA論文では、ある先生が『ATEのnull effectとITEでのsharp nullを区別せずに、拡大解釈で帰無仮説の妥当性が声高に叫ばれるようになるとすれば好ましくない気がします』とのコメントされていてもっともだなと思っています。で、ベイズの定理自体は医療者であれば医学部で習う知識なので知っていると思います。

ただし、厳密には2つのテストが独立である必要があります。例えば下記の感染症トップジャーナルのClin Infect Disから出版された論文に対して岩田先生や遠藤先生から結構厳しいレターが投稿されています。二つのテストが独立じゃないから注意する必要がある、という点ですね。まあでも、これはそういうものでもあるとかないとか。。

" In addition, it is clinically possible and even reasonable to surmise that NPS and saliva specimens are interrelated and not independent, and this adds additional parameter for correlation, making estimation of posterior probability not feasible"

ベイズの定理からベイズ統計へ繋げるのが難しい

ベイズの定理の数式から関数に変わるタイミングで大体挫折するんですよね。参加してるインターンの子とかは理解してたので、数学に慣れてる医学生の方が理解が早いかもしれません。

ベイズ統計ではベイズの定理に基づいて、事後分布を事前分布と尤度関数の積に基づいて導出します。

f(x)を事前分布として、データDが与えられた時のパラメータf(θ|D)を求めると
f(θ|D) = f(D|θ)・f(θ) / ∮f(D|θ)F(θ)dθ
となりますが、∮f(D|θ)F(θ)dθの積分部分を求めるのが難しいのでモンテカルロシミュレーションなどで求める訳です。

で、ここで共役事前分布という考え方があります。上記積分部分の計算が重たいので共役事前分布という概念を用いて計算を簡略化しようというイメージです。共役事前分布に尤度をかけて事後分布を求めると、その関数形が同じ分布になります。つまり、共役事前分布を使えば、事前分布と事後分布は同じ形になります。

つまり、Stanとかでモンテカルロシミュレーションなどをしなくても、事前分布が数学的に綺麗に合うものがあれば共益事前分布を用いるだけで計算できる。例えば事前分布が正規分布と仮定できるなら、事後分布も正規分布となります。多くの臨床研究論文、特にRCTは正規分布か二項分布を仮定できるので、NEJM Evidの論文もJAMAの論文もこれを用いているだけなので、複雑な計算はしていません(RCTのデータさえ持っていればいいわけで)。

耒田先生の発表スライドより「ざっくりとした事前分布の選択」

ちなみに有名な松浦本「StanとRでベイズ統計モデリング」では、コンピュータの性能がいいので、わざわざ使わなくていいと書いてあるそうですが、それはそれができる人の言葉ですよね…というオチ笑

これらの話がそれなりの医学雑誌に載るのは、ベイズの人から見たら、今更何言ってんねんくらいの感覚?かもしれませんが、臨床医からするとだいぶ遠いですよね。ベイズで論文書いたけど「頻度論で解析しなおせ」とコメントが来たなんで話もあるそうで。

ただ、『臨床医がよく頻度論の結果を間違えて解釈してしまう点はベイズで説明がつく』・『そもそも医学に最初に頻度論を持ち込んだのが間違い』、というコメントがあって、それはそうかもしれないと思った次第。それこそ95%信頼区間とか笑

やっぱりベイズ?

下記は原先生による追加ディスカッションの部分(一部)。僕はふむふむと聞いていただけです笑

ベイズの方が解釈に優れるから使ってみようよみたいな流れは多分50年前とかからあります。

・nが小さい時とか、computationalな問題があると、事前分布を与えて解決したいけど、その事前分布は妥当なの?みたいなツッコミが厳しい。
・無情報事前分布(non-informative prior)だったらpriorの仮定なくて大丈夫でしょって言いたいけど、そうすると頻度論と本質的な結果は一緒(nが小さいときはposteriorがすごい広いし、computationalな問題は解決しない)。
・結局頻度論の肝である検定が意思決定に影響を与えている。仮にベイズでposteriorが何%とか言われても、直感的なわかりやすさはあるけど、じゃあ何%で何が起きるんだったら意思決定変えるのみたいなのをその後規定するのが回り道感がある。

あたりがこれまで一度も臨床研究の表舞台でベイズが陽の目を見ていない理由ではないかと。

多分informative priorを許容するだけのメリットをそのフィールドの人達が感じるか?というところがそのフィールドでベイズが浸透するかのポイントで、臨床研究では中々この要件を満たさないだろうなと思っています。

Editorが一時的に使えると思う?みたいなmovementを起こすのは理解可能で、editorの気持ちとして、ここしばらく話題に登ってきていないから、またresearch communityにベイズをacceptするか聞いてみよう、でも多分ダメだろう、と。


この記事が気に入ったらサポートをしてみませんか?