有意差を示せなかったランダム化臨床治験では尤度比が効果のなさの証拠となりえる

2023年6月21日 09:56

“RCT治験において統計学的優位でない結果に加え、尤度比を報告することで、特に主要アウトカムにおける観察された差が統計的に有意でない場合に、臨床試験の解釈を改善することができる”というネガティブな結果に悩まされ続けた我々臨床家にとってありがたい？報告

Perneger, Thomas, and Angèle Gayet-Ageron. “Evidence of Lack of Treatment Efficacy Derived From Statistically Nons Ignificant Results of Randomized Clinical Trials.” JAMA 329, no. 23 (June 20, 2023): 2050–56. https://doi.org/10.1001/jama.2023.8549 .

重要ポイント

【疑問点】ランダム化臨床試験の統計的に有意でない結果は、新しい治療法の効果がないことの決定的な証拠となり得るか？
【知見】2021年に発表された169件の統計的に有意でない無作為化試験の主要アウトカム結果において、効果なし（帰無仮説）と臨床的に意味のある効果（代替仮説）の仮説を尤度比を用いて比較し、観察された試験結果が一方の仮説と他方の仮説を支持する強さを定量化した。約半数（52.1%）が効果なしと代替仮説について100以上の尤度比をもたらした。
【意味】多くの統計的に有意でない臨床試験結果は、新しい治療法の効果がないことを示す決定的な証拠である。

概要

【重要性】多くの無作為化臨床試験で、統計的に有意でない結果が得られる。このような結果は、支配的な統計的枠組みで解釈することは困難である。
【目的】無作為化臨床試験の有意でない主要アウトカム結果のうち、効果なしという帰無仮説を支持する証拠の強さを、尤度比の適用により、事前に指定した効果仮説と比較して推定すること。
【デザイン、設定、参加者】 2021年に主要な一般医学雑誌6誌に掲載された無作為化臨床試験の主要アウトカムの統計的に有意でない結果を対象とした横断的な研究である。
【アウトカム指標】効果なしという帰無仮説と、試験プロトコールに記載された効果仮説（代替仮説）の尤度比。尤度比は、データが一方の仮説と他方の仮説に与える支持を定量化するものです。
【結果】主要アウトカムについて169件の統計的に有意でない結果を報告した130件の論文において、15件（8.9%）が代替仮説（尤度比、＜1）を支持し、154件（91.1%）が効果なしの帰無仮説（尤度比、＞1）を支持した。
尤度比が10を超えたのは117人（69.2%）で、100を超えたのは88人（52.1%）で、1000を超えたのは50人（29.6%）であった。
尤度比はP値と弱い相関しかなかった（Spearman r, 0.16; P = .045）。
【結論】ランダム化臨床試験の統計的に有意でない主要アウトカムの結果の多くは、先験的に示された臨床的有効性の代替仮説に対して、効果なしという仮説を強く支持するものであった。尤度比を報告することで、特に主要アウトカムにおける観察された差が統計的に有意でない場合に、臨床試験の解釈を改善することができる。

【www.DeepL.com/Translator（無料版）で翻訳しました。】

序文要約 written with ChatGPT4

ランダム化された臨床試験の目的は、新しい治療法の有効性についての確かで行動可能な証拠を提供することです。適切に行われたランダム化試験が新治療法の統計的に有意な利益を見つけると、証拠の解釈は直接的です：データは新しい治療法が効果があることを示しています。しかし、群間の差が統計的に有意ではない場合、これは頻繁に起こり、証拠は不確定と見なされます。研究者は、「証拠の欠如は存在の証拠ではない」という言葉で捉えられるように、統計的有意性の欠如と効果の欠如を混同しないよう警告されます。この推論はフィッシャーの統計学的伝統に従います：実験は検証された仮説に対する証拠を提供することしかできません、それは決して正しいとは証明されません。したがって、統計的に有意でない結果を得た研究者は立ち往生しています：彼らは効果を否定する以上に有効性を主張することはできません。これが、「治療は結果を有意に改善しなかった」といった非決定的な結論の増加を説明しています。これらの言葉は、観察された結果の単なる繰り返しであり、あたかも医師が患者にテストが陰性だったと告げ、病気の存在や不在についてカウンセリングしなかったかのようです。
この問題を解決する一つの方法は、治療効果の指標となる全てのCI、例えばリスク差、オッズ比、ハザード比などを考慮することです。任意のパラメータ値は観察されたデータと互換性があると見なされます。統計的に有意でない結果のCIが臨床的に意味のある値を除外する場合、臨床的に意味のある効果が存在しないと結論付けることができますが、CIは通常、効果性パラメータの臨床的に意味のある値と臨床的に無視できる値の両方を含み、そのような結果は曖昧なままです。
この研究では、代替のアプローチを提案します。これは観察された試験データを考慮に入れた、効果の無い帰無仮説と効果のある代替仮説（研究者がサンプルサイズの計算で述べている通り）の直接的な比較に基づいています。この推論は診断プロセスに似ています、診断テストの結果を考慮に入れた病気が存在するか否かの確率を医師が比較する時と同じです。比較は尤度比（LR）の観点から表現され、これは観察された結果が一つの仮説に対して他の仮説と比較して提供する支持の強さを量化します。我々はこの方法を公表された統計的に有意でない臨床試験の結果のサンプルに適用し、そのような結果が帰無仮説を代替仮説に優先させる程度を推定します。

LRの計算と解釈

統計的に有意でない各試験結果について、帰無仮説（$${H_N}$$）と治験責任医師が指定した代替仮説（$${H_A}$$）のLRを計算した（ボックス）。LRは、ある仮説に対するデータの相対的な支持を測定する。例えば、LRが5であれば、データは帰無仮説を対立仮説の5倍強く支持することを意味する。これは対称的な尺度である： $${H_N}$$対$${H_A}$$のLR=5は、$${H_A}$$対$${H_N}$$のLR=1/5と同じである。

尤度比（Likelihood Ratio）の計算

尤度比は、2つの仮説の下で観察された結果（例えば、主要転帰のz統計量）の確率密度（f）の比に相当する11。

zが正規分布している場合、帰無仮説と対立仮説（HNとHA）の尤度比の自然対数は次のようになる。

尤度とは２つの仮説に基づく、観察結果（e.g. プライマリアウトカムのz統計)の確率密度関数(f)の比に相当

尤度比は出版トライアル結果から容易に導ける。ｚが正規分布なら、帰無仮説 vs 対立仮説 ($${H_N vs H_a}$$)の尤度比の自然対数で計算

Here z is the test statistic for the measure of effect (ie, θ̂/se[θ̂], where θ̂ is the estimate of the effectiveness parameter obtained in the trial, as se[θ] its standard error). N is the value of the effectiveness parameter under HN expressed in se(θ̂) units (ie, θN/se[θ̂]). In most cases N equals 0. A is the value of the effectiveness parameter under HA expressed in se(θ̂) units (ie, θA/se[θ̂]). The effectiveness parameter θ is left in natural units for differences of means or proportions and was logarithm transformed for multiplicative measures, such as the hazard ratio. The standard error se(θ̂) can be computed from the 95% CI for θ (or log[θ]), by dividing the width of the CI by 3.92 (2 × 1.96).
（後で、訳とともに、Latex表記をするつもり）

discussion 要約 written with ChatGPT4

この研究は、ランダム化臨床試験から得られた統計的に有意でない結果の多く（しかし全てではない）が、試験プロトコルで特定された効果仮説に対する無効仮説を支持する強力な証拠を提供していることを明らかにした。
169件の統計的に有意でない主要結果をサンプルとして、無効仮説に対する事前指定された代替仮説の尤度比（LR）の約70％が10を超え、50％が100を超え、30％が1000を超えた。
試験開始時に研究者が均衡状態にあった場合、100以上のLRは、治療法が無効であるという試験後の確率を、ほぼ確実性に近いレベルまで増加させる。このような場合、治療法のさらなる研究はおそらく停止すべきである。
残りの結果（約30％）は、いずれの仮説に対しても弱いから中程度の支持を提供し、その主題に関するさらなる研究を正当化する。
現在の統計的ガイドラインは、統計的に有意でない結果は証拠の内容を欠いていると指摘している。しかし、LRの分析は、そのような結果の少なくとも半分については、観察されたデータが事前指定された効果仮説よりも無効仮説を強く支持していることを示している。
LRはまた、治療効果の信頼区間（CI）の解釈を改善する。CIが効果パラメータの臨床的に意味のある値だけ、または臨床的に無視できる値だけを含む場合は解釈が容易だが、しばしば両方を含むことがあり、その場合、CIは有用な証拠を提供しない。LRにはこのような限界はない。
また、この研究では、CIが無効なパラメータ値を含んでいても代替パラメータ値を含んでいないということは、無効な仮説が十分に支持されていることを意味しなかった。これらの結果の正確な解釈にはLRの計算が有益であった。

この記事が気に入ったらサポートをしてみませんか？