「イベルメクチンの COVID-19 臨床試験成績のメタ分析に関する一考察」の考察
以前に↓の記事でその手法のおかしさについて解説したメタ解析サイトを、「最も情報量が多く、選択によるバイアスが掛かっておらず公正であると 考えられる」と紹介している論考を発見した。北里大学大村智記念研究所 客員教授 八木澤氏によるものである。
どのような論拠を基にしているのか、詳述してあり有り難いが、同意できない点が複数あるため、以下に述べる。
まず、このサイトは適宜改訂されているので、(行われている解析はともかく)どのような研究が現在までに行われているのかを概観するのには役に立つ。この点は同意。
サイト内で紹介されている研究に関して以下のように述べる。
しかし、RCTや査読はその質を担保しない。RCTにはRCTの質を評価するための標準的なツール(ROB2:https://sites.google.com/site/riskofbiastool/welcome/rob-2-0-tool)
が存在し、これを用いてRCTの「中身」を評価する必要がある。これに基づきWHOは一部の試験結果の質が低いと判断しているのであり、「論議は当を得ていない」というのは誤解である。
次に以下のように述べているが、ここで引用されている確率はミスリーディングである。
この確率はどうやって計算されているか。これは研究の結果を見て、その結果が効果あり(例:死亡率減少のリスク比が1未満)か効果なし(リスク比が1以上)の2種類に分ける。次に効果がありという結果が出ている研究の数を数えて(Xとする)、仮に効果がない場合に偶然にX個以上の研究で効果があるという結果が得られる数を計算している。1月6日時点でサイトを確認すると、73の研究中65で効果があったと判定されている。要は両面の出る確率が等しいコイン(つまり効果がない)コインを73回投げて、表が偶然65回以上でる確率を計算しているのと同様である。
しかしながらいくつかの問題点がある。
①研究のバイアスが考慮されていない。本当は効果が乏しくても効果があるという結果がバイアスによって得られている可能性がある。
②効果がある結果ほど出版されやすいという出版バイアスにより、効果のある研究の数が多く見積もられている可能性
③過去記事で言及したように、そもそも純粋にイベルメクチンの効果を検証するのに適さない、併用薬の使用や対照群で別の治療を施されている研究も数に含まれている。
④各研究ごとの「重み」が考慮されていない。参加数が多い患者のほうがより正確な効果の推定を可能にする。
次にこの論考では複数のメタ解析論文を取り上げて、
しかしながら異なる論文が採用されてるのは論文の組み入れ基準が微妙に異なるからである。例えばPoppらはバイアスのリスクが高いと考えられる論文を除外しているし、イベルメクチンの効果を検証するのにベストなイベルメクチンvsプラセボまたは標準治療を比較した研究に限っている。Romanらによるメタ解析も同様な比較研究に限っている。一方、BIRDやFLCCCらの論文にはそのような配慮がなされていない。
また八木澤氏は
と述べているが、実際はその後にNiaeeらの研究にも疑義が呈されていて、この書簡ではこの研究が除外されていない。
ちなみにRomanらのメタ解析でミスがあったことを取り上げ厳しく批判する。
ミスをしたのは残念であるが、実際は出版論文では訂正されているので、結果自体には影響がない。よって本質を突いた批判ではない。訂正後のRRの合算は確かに死亡に対して0.37 であるが信頼区間が広いかつ、他のアウトカムで効果がみられないので、さらにRCTが必要で、現時点では臨床試験では投与すべきと述べており、妥当な結論であろう。さらにこの結果もNiaeeを含み、その全体に占める重みは41%。これを除外すると効果はさらに不明瞭になる。
ここで八木澤氏は別の研究を引用している。
ここで引用される以下の論文は、Bryant、Romanらのメタ解析に含まれた論文の結果をベイズ推定を用いてメタ解析を行っている。
何やら凄そうな解析に見えるかもしれないが、実際は含まれている研究が同じなので、著者の主張に反して私の解釈ではあまり確信度の高い結果が得られていない。
まず著者らは以下のように、systematic reviewの手法として標準的におこなわれるバイアスの評価を "somewhat vague and possibly biased subjective assessment"として無視。
バイアスを無視して結果を統合したら効果が見られたという先述のメタ解析サイトと本質的には同じである。
RCTにおけるバイアスの要因(盲検のなしや不適切なランダム化)は客観的なアウトカム(例:死亡)にはあまり関係ないという意見もある。私も「一般的には」バイアスの影響は起きにくいとは考える。しかし、ケースバイケースなので、実データがある場合は実データで確認すべき。
以下の論文で分析されているように、バイアスのリスクが高いイベルメクチンの研究を除外すると、効果が確認できなかったという分析がなされており、バイアス評価を無視するのは暴論と考える。
同論文では疑義が呈されたElgazarrらの研究を除外した感度分析を行っているが、効果がみられる可能性は77-78%と出ているが、CIも非常に幅広く(RRに関しては0-156)、あまり確信を深める結果ではない。
元の論考に戻る。次いでPoppらによるCochraneレビューも厳しく批判している。
しかしながら、"様々な条件を課して解析対象とする試験を選択するという作為が加え られている"というのは、Research questionに合致する研究を含めたり、バイアスが高い研究を除外することで、臨床応用を考慮する上でバイアスのリスクが少ない有用な情報を提供するための工夫であり、システマティックレビューの根幹である。
ここからこの論考ではReal-world Medicineについて論述し、既存のEBMを批判する。例えば
ではステロイドの効果を示した、Recovery trialはどう考えるのか。RCTで効果が示されずにここまで標準的な治療として普及したのか。未だにその是非について議論が続いていたのではないだろうか。
また以下のようにも述べる。
ではサイトによると303の研究があるヒドロキシクロロキンをどう考えるのか。大規模RCTで効果は否定されたが、使い続けるべきと考えるのか?RCTで効果が否定されなければいまだに議論の渦中にあり、別の治療薬についての議論の進んでいなかったのではないか。
また医師の経験則が無視されたり排除されていると述べる。
これもよくある意見だが、先述のメタ解析でも亜鉛、ビタミンDなど多種多様な「治療候補薬」が提唱されているが、どの専門家の「経験」を重視するかはどのように決めるのだろうか?診た患者数が多く、○○の治療で100以上に治療して誰も死んでいないという意見があればその意見は信用できるのだろうか。
私だったらせめて、具体的に何人治療して、その平均年齢や、重症度、合併症などを知りたい。また、同じ医師で治療をしていない患者でどうだったかも知りたいし、可能あれば、治療した人としてない人の属性が似た人でどうだったか教えてほしい。これらの情報をまとめたものが論文である。
しばしば論文のデータを引用すると、現場とかけ離れたものかのように批判する人がいるが、あくまで現場とは地続きである。実際に行われる診療をきちんとした評価・分析方法をもってまとめて報告したものが論文になる。
EBMは100%の正解を与えるわけではない。しかし、EBMは無数の情報がある中で、より正解に近い意思決定を行うための重要な営為であると考える。
エビデンスを創りだすのは時間がかかる。しかし今回のパンデミックでは素早くエビデンスを確立するための試みが多くなされている。実際に↓のような多くの治験が重要なエビデンスを提供してきた。
また、2016年のエボラ出血熱流行時にもコンゴ民主共和国で治療薬のRCTが行われ有効な治療薬の確立に貢献した。
https://www.nejm.org/doi/full/10.1056/NEJMoa1910993
この治験のおかげでエボラ出血熱に対して有効な治療薬を自信をもって拡大することができ、より多くの人命を救うであろう。COVID-19のような急性の感染症であっても、質の高い治験の存在意義はなくならない。
注1:ランダム効果モデルを用いると小規模な研究の重みが相対的に大きくなる。特に、小規模な研究でバイアスのリスクが高いと、メタ解析結果のバイアスのリスクも高くなる。
追記:Pyloriさんから手法に関する質問を複数頂きました。ツリーに回答を記載しています。
この記事が気に入ったらサポートをしてみませんか?