診療ガイドラインの動向とコンセンサス

診療ガイドラインの作成方法は、いまだに議論が続いている。その一端を紹介する。GRADEアプローチが最も良いという観点での記載になっています。


診療ガイドライン作成方法の歴史(いろいろ前後して記載)

・教科書では、現場で、どの治療を行ってよいか結局わからないので、実践的なガイドラインが必要。医学の進歩が早くなり、教科書に記載されてないような新しい治療が有効かを知ることが必要になった。そのため、ガイドラインが作成された。当初は、権威のある有名な先生が集まって、密室でガイドラインを作成。
・それではいけないと、コンセンサスを大切にして、しっかりと議論して作成するようになった。
・でも、それでは科学的でないし、恣意的であるので、ランダム化比較試験の研究なら強く推奨し、観察研究なら弱く推奨するなど、研究デザインから推奨が自動的に決まることにして、恣意的な要因を排除した。
→これを推奨したのが、「Minds 2007」
→この時に研究デザインを、「エビデンスレベル」として分類した。これの最も有名な分類が、Oxford Centre for Evidence-based Medicine(Oxforf CEBM)の分類であり、システマティックレビュー(SR)だからエビデンスレベルが高いというものでなく、その中のランダム化比較試験の質(現在ではバイアスのリスクと表現)が低ければSRのレベルも低いとしていたが、単なる研究デザインのみの分類と、世界中で誤用が広がった。
・ガイドラインは作っただけなく、その評価も重要だとされるようになった。
→これが、AGREEチェックリストで、2003年に初版が出版
・ランダム比較試験と言っても、A治療が勝つのから、逆に負けるのまである。よって、研究を恣意的に選んではいけないので、SRに基づく事が必要となった。
・SRに基づくと言っても、利益だけでなく、害も必要であるなどが議論されるようになった。
◯旧IOMの定義発表:2011年:ここから一般のガイドラインと「診療ガイドライン」という用語を区別すべきとの認識が広まった。
Clinical Practice Guidelines are statements that include recommendations intended to optimize patient care that are informed by a systematic review of evidence and an assessment of the benefits and harms of alternative care options.(診療ガイドラインはエビデンスのシステマティックレビューと複数の治療選択肢の利益と害の評価に基づいて患者ケアを最適化するための推奨を含む文書である。)
・このあたりから、患者代表がパネリストに参加した方が良いという考えもでてきた。
◎SRと言っても、まずSRの質が大切(いい加減に作成したSRでは、その結果(エビデンス)も信用できない)。また、質の高いSRであっても、その中の結果(エビデンス)の確実性が低い場合(例えば、研究ごとに結果が異なっているなど)と、高い場合があることを考えないといけないことが述べられるようになった。さらに、エビデンスの確実性、利益と害のバランスだけでなく、コストや患者の価値観も、推奨の強さには重要であり、その手順を明確にするべきとされた(よって、研究デザインから自動的に推奨が決まることはなくなった)。
→これがGRADEアプローチだが、実は、2000年から開発が進んでいた。
GRADEアプローチが徐々に世界標準となった。また、コクランレビューもGRADEアプローチのエビデンスの確実性の方法論を取り入れた。
→GRADEアプローチでは、当初は、エビデンスの確実性を、エビデンスの質や信頼性と記載した事もあった(エビデンスの強さと記載したのはGRADEアプローチの本家ではなかったと思うが、Mindsは、なぜか当初、このエビデンスの強さを採用した(現在でも、その記載が残っている))。
・しかし、GRADEアプローチでは、エビデンスがほぼない場合に推奨したい治療が推奨できなくなるので、エビデンスが乏しい場合は、コンセンサスに従って推奨し、エビデンスがある場合は、GRADEアプローチなどエビデンスに従って推奨しようという考えが出てきた。⇒(1)
・いやいや、GRADEアプローチは、エビデンスが乏しい場合も、しっかりと方法論があり(⇒(2の1・2))、それに従いましょうという反論⇒(3)がでたが、あまり注目されず。
・そもそも、IOMの定義に従ってすべての推奨のためにSRを行うのは効率が悪い。まずは、コンセンサスで70%以上一致するのは、そのまま推奨して、そうでないものをSRを行ってIOMの定義で作った方が効率がよいという考えが出てきた。⇒(4)
・いやいや、GRADEアプローチは、効率も考えているし、すべての臨床疑問(CQ)に対して推奨しろと言ってない(⇒(5))という反論⇒(6)がでているが、どうなるでしょうか。
・やはりGRADEアプローチは良いし、それなら、その枠組みをしっかりと使った診療ガイドラインを作成し、今後は、新しい研究がでたら、その枠組みに追加するだけで、どんどん、改定できるので便利だよねという開発が進んでいる。
→これが、MAGIC( MAGICapp)・ Living Guidelinesという動きである。
・さらに、定量的に利益と害が評価できるならば、アウトカムの価値(効用値みたいなもの)も定量的に評価して、アウトカム全般にわたる正味の利益を数量的に評価して、それを患者の判断の閾値(効用値みたいなもの)に合わせたら、推奨が自動的に決まるのでは?という所まで考えられている(もちろんGRADEアプローチでは、パネリストの判断であり、自動的に評価することを薦めていないが、進んでいる方向は自動だな)。⇒(7)
・これまではA治療とB治療の比較のような推奨だったが、A治療・B治療・C治療・D治療のどれが最も推奨できるのかという、多介入比較・ネットワークメタ分析などの手法による推奨作成が増えてきている。しかし、まだまだ発展途中である。

GRADEアプローチ

GRADEアプローチでは、推奨を5タイプに分けている:formal recommendation・informal recommendation・ research only recommendation・implementation consideration・good or best practice statements

注意:GRADEアプローチでも、コンセンサスを用いている:各ステップごとに、パネルのコンセンサスが必要であり、かつ、エビデンスの確実性が低〜非常に低で、推奨が強の場合(整合性に欠ける(discordant)推奨)の時はコンセンサスが重要な要因とならざるおえないが、単なるコンセンサスでないことが重要としている。

GRADEアプローチにおけるgood or best practice statementsとは?<ここの意味を取り違えている可能性が高い>

Good Practice Statementsは、体系的にエビデンスを特定するためのリソースが不足しているために作成するのではなく、明確な提言にも関わらず間接的なエビデンスしかない場合に用いられる⇒著者も、間違っていたので、スライドでまとめた https://www.docswell.com/s/MXE05064/5NR8GR-2023-11-24-150639

good or best practice statements

  1.  ⇒(5)good practice statementsなので推奨を作成しない(*)

  2.  ⇒(2の1)good or best practice statementsであるが、EtD(Evidence-to-Decision(EtD)フレームワーク)を作って推奨を作成する
    ●この場合、論文が無い場合があるが、無いからと言って確実性が低でなく、正味利益が大きく、なおかつ疑いの余地のないものなら確実性は高でもよい
    ●ガイドライン委員会が、ある介入の望ましい効果がその望ましくない効果を明らかに上回るという確実性を高いと判断しても、それを支持する一連のエビデンスが間接的(indirect)であることがある。このような場合、推奨の強さを評価するGRADEアプローチの適用が不適切である(たぶん、SRを行なって普通にグレーディングすると確実性などがおかしくなるという意味などだろう)。その代わりに、GRADE作業部会は、グレードしない(ungradedとあるので確実性だろう)ベストまたはグッドプラクティスステートメント(GPS)を作成する。

文献:Good or best practice statementsの作成のガイダンス:Good or best practice statements: proposal for the operationalisation and implementation of GRADE guidance https://ebm.bmj.com/content/early/2022/04/24/bmjebm-2022-111962

formal recommendation

  1.  SRを行なって定性的に評価、EtDを作って推奨を作成する
    いわゆる定性的システマティックレビューです。その中でも、エビデンスがが僅かなサンプルのケースシリーズしかないようなら以下のような手順を踏むと、単なるコンセンサスよりはよほど客観的で良い。
    ⇒(2の2)エビデンスが僅かなサンプルのケースシリーズしかないようなら、パネリストの専門家にアンケート調査を行って、ケースシリーズ研究みたいなエビデンスを作成する。それのエビデンスの確実性は低いが、EtD表を作ってアウトカム全般にわたる評価を客観的に行う。
    動画:EBM診療ガイドライン作成編1:エビデンスがない場合・エビデンスの確実性が非常に低よりさらに低と思われる場合の推奨

  2.  SRを行なって定量的に評価、利益と害のバランスは、定性的に行なって、EtDを作って推奨を作成する

  3.  ⇒(7)SRを行なって定量的に評価、利益と害のバランスも定量的に評価、さらにアウトカムの価値観も数量的に評価(効用値みたいなもの)して、して、「正味の効果推定値」を算出して、患者の判断の閾値とともに、EtDを作って推奨を作成する(完全コンテキスト化)
    文献:Defining certainty of net benefit: a GRADE concept paper 
    オンラインで計算できるサイト:http://net-effect.wisdmforafib.com/  2023/02/03はアクセスできず

ACC/AHAとASCOなどのコンセンサス推奨

⇒(1)エビデンスが乏しい場合は、コンセンサスベース推奨を行ない、エビデンスベースと分類する
具体的には、SRの手法で論文を系統的に検索後、Summary Evidence base considered by panel prior to completing Delphi Surveyという、利益と害のサマリー(下図)を作成して、それを基に修正 Delphi法である RAND/UCLA 法で9点法の合意形成を行なう。よって、ACC/AHAとASCOなどのコンセンサス推奨は、GRADEアプローチの場合のコンセンサス(EtD表を作成し、よりアウトカム全般に渡る評価)とは、根本的に異なる。

文献:ACC/AHAとASCOなどのコンセンサス推奨の例(実際のエビデンス表は付録1)
Hopkins C, Alanin M, Philpott C, Harries P, Whitcroft K, Qureishi A, Anari S, Ramakrishnan Y, Sama A, Davies E, Stew B, Gane S, Carrie S, Hathorn I, Bhalla R, Kelly C, Hill N, Boak D, Nirmal Kumar B. Management of new onset loss of sense of smell during the COVID-19 pandemic - BRS Consensus Guidelines. Clin Otolaryngol. 2021 Jan;46(1):16-22. doi: 10.1111/coa.13636. Epub 2020 Sep 24. PMID: 32854169; PMCID: PMC7461026.
https://www.ncbi.nlm.nih.gov/pmc/articles/PMC7461026/

⇒(3)文献:ACC/AHAとASCOなどのコンセンサス推奨は問題が多いとの論文
Discordant and inappropriate discordant recommendations in consensus and evidence based guidelines: empirical analysis
https://www.bmj.com/content/375/bmj-2021-066045

⇒(3)文献:ACC/AHAなどのコンセンサス推奨に対するGRADEアプローチ推奨者からの反論
Evidence vs Consensus in Clinical Practice Guidelines
https://www.ncbi.nlm.nih.gov/pmc/articles/PMC7275374/pdf/nihms-1594301.pdf

CORE process(Convergence of Opinion on Recommendations and Evidence process(by American Thoracic Society))

⇒(4)CQ(AかBか)とPICOとエビデンスの確実性の4段階と推奨文の4つのパターン(A強い推奨・A条件付き推奨・B条件付き推奨・B強い推奨)のみから(下図の投票用紙)、修正Delphi法で、4つのパターンのどれかを選ぶ方法を使って、70%の同意を得たら、そのまま使う、70%の同意を得なければ、IOM準拠のプロセス(すなわちSRを行なう)となる。
よって、一面は、GRADEアプローチの推奨するまでもないgood or best practice statements(*)を投票で選んでいるとも言えるし、いやいや、本来は、GRADEアプローチで作成すべきCQまでも、このCORE processで作成して間違った推奨を行っている可能性もあるので、GRADEアプローチの観点からすると間違った手法だとする考えもある(これが以下の⇒(6)文献

文献:CORE processの説明論文(付録の図に実際の投票用紙がある)
A Comparative Analysis of Pulmonary and Critical Care Medicine Guideline Development Methodologies
https://www.atsjournals.org/doi/10.1164/rccm.201705-0926OC

文献:CORE processを使うとCPG作成が楽だったとする
Wilson KC, Schoenberg NC, Cohn DL, Crothers K, Fennelly KP, Metlay JP, Saukkonen JJ, Strange C, Waterer G, Dweik R. Community-acquired Pneumonia Guideline Recommendations-Impact of a Consensus-based Process versus Systematic Reviews. Clin Infect Dis. 2021 Oct 5;73(7):e1467-e1475. doi: 10.1093/cid/ciaa1428. PMID: 32964218; PMCID: PMC8677595.
https://www.ncbi.nlm.nih.gov/pmc/articles/PMC8677595/

⇒(6)文献:GRADEアプローチの推奨者は、CORE processを反対している
Consensus (Convergence of Opinion on Recommendations and Evidence [CORE]) Versus Systematic (Grading of Recommendations Assessment, Development, and Evaluation [GRADE]) Approach to Development of Guidelines for Community-acquired Pneumonia
https://academic.oup.com/cid/article/73/7/e1476/5924479?login=false

例:グッドプラクティスと、一般のGRADEアプローチのグレーディングされた推奨の併用の例

最終的に、CPGとSRとしてまとめるときに、診療ガイドラインの冒頭の方の文章で読書ガイドをつけておく例です。Google翻訳などで日本語でみてください
National klinisk retningslinje for perioperativ mundhygiejne til forebyggelse af postoperative infektioner v1.0published on 2021年4月12日 作成中https://app.magicapp.org/#/guideline/4259
ここの、1 Læsevejledningをクリックすると、以下の用に書かれています。

1リーダーズガイド セクションの文章を見る
本ガイドラインは、2つの層で構成されています:

1. レイヤー - 推奨事項
強く推奨する(緑色):賛成の強い推奨は、介入の全体的な利益が害を明らかに上回ることを示す高品質の証拠がある場合に与えられる。これは、すべての患者、あるいはほとんどすべての患者が、推奨された介入を望むことを意味する。
反対を強く推奨する(緑+赤):強い反対推奨は、その介入の全体的な不利益が利益を明らかに上回ることを示す質の高い証拠がある場合に与えられる。強い反対推奨は、エビデンスのレビューにより、介入がほぼ確実に無益であることが示された場合にも用いられる。
弱い/条件付き賛成勧告(黄)(Weak/conditional recommendation in favor:介入の利益が害を上回ると判断される場合、または利用可能なエビデンスから介入の著しい利益を否定できず、一方で害はほとんどないかないと判断される場合に、介入を支持する弱い/条件付きの勧告がなされる。この勧告は、患者の好みが異なると判断される場合にも使用される。
弱い/条件付き反対推奨(黄+赤):介入のデメリットがベネフィットを上回ると判断されるが、強力なエビデンスによって裏付けられていない場合に、介入に対する弱い/条件付きの推奨がなされる。この勧告は、有益な効果と有害な効果の両方について強い証拠があるが、それらのバランスを判断することが困難な場合にも用いられる。同様に、患者の好みが様々であると判断される場合にも使用される。

グッドプラクティス(グレー):グッドプラクティスは、関連するエビデンスがない場合に用いられ、臨床ガイドラインを作成したワーキンググループのメンバー間の専門的なコンセンサスに基づいている。推奨は、介入に賛成か反対かのどちらかである。専門家のコンセンサスであるため、このタイプの推奨は、エビデンスに基づく推奨が強いか弱いかにかかわらず、エビデンスに基づく推奨よりも弱い。

追記

まだ、理解できてない。どういうことか???
Next-generation Allergic Rhinitis and Its Impact on Asthma (ARIA) guidelines for allergic rhinitis based on Grading of Recommendations Assessment, Development and Evaluation (GRADE) and real-world evidence
https://www.sciencedirect.com/science/article/pii/S009167491931187X

アレルギー性鼻炎患者に対する薬物療法の選択は、疾患のコントロールを目的としており、多くの要因に依存する。GRADE(Grading of Recommendations Assessment, Development and Evaluation)ガイドラインにより、アレルギー性鼻炎の治療法はかなり改善されました。しかし、特にランダム化比較試験は結果の適用性に関して制限されることが多いため、実世界のエビデンスを臨床実践に役立てようという傾向が強まっています。Contre les Maladies Chroniques pour un Vieillissement Actif(MACVIA)アルゴリズムは、コンセンサスグループによってアレルギー性鼻炎の治療法を提案しています。このシンプルなアルゴリズムは、アレルギー性鼻炎治療のステップアップやステップダウンに利用できる。アレルギー性鼻炎の薬物療法に関する次世代ガイドラインは、既存のGRADEに基づく本疾患のガイドライン、モバイル技術によって提供される実世界のエビデンス、およびMACVIAアルゴリズムを改良するための添加物試験(アレルゲンチャンバー試験)を用いて開発されました。

この記事が気に入ったらサポートをしてみませんか?