見出し画像

デジタルバイオマーカー/エンドポイントを利用した臨床試験の実現可能性【前編】

 閲覧ありがとうございます。データサイエンティストの杉尾です。主にデジタルバイオマーカーの開発プラットフォームである(selfbase)の機能開発や、そこで収集されたデータの解析を担当しております。
 今回は、「臨床試験におけるデジタルバイオマーカー・デジタルエンドポイントの選定方法」をテーマに整理していきます。

では、背景から。

臨床試験におけるデジタルバイオマーカーへの期待と課題

 ウェアラブル、小型デバイス、またはアルゴリズムの進化によって、新しいデジタルバイオマーカー(Digital Biomarker, dBM)またデジタルエンドポイント(Digital Endpoints)は、臨床試験(Clinical Trial)において大きな期待を集めています。
 しかし、これらの新しい測定値の検証プロセスやガイドラインが確立していないため、(特に日本は)その導入が遅れています。

 では、どのようにしてデジタルバイオマーカーを検証し、選定していけばいいのでしょうか。

 まだまだ勉強中ではございますが、国内外の論文や記事を拝読する過程で、自身らの整理も兼ねて、記事としてまとめたいと思います。(主にKruizinga MD氏の論文[1]を参考に記述しております。)

 さて、デジタルバイオマーカーの選定は、
1. 技術的なバリデーションの観点
2. 臨床的なバリデーションの観点
に分けて考えることができるとされています[1]。
そして、この記事では、「1. 技術的なバリデーションの観点」に関して整理していきます。

 その前に、用語の整理をします。

デジタルバイオマーカー&デジタルエンドポイント

 多くの記事や論文、記事内でも多く使用される「バイオマーカー」と「エンドポイント」について整理をします。
 まず「バイオマーカー」とは、

・生体内の生物学的変化を定量的(もしくは定性的)に把握するため、生体情報を数値化・定量化した指標(血糖値、コレステロール値、心電図、血圧など)
・「正常なプロセスや病的プロセス、あるいは治療に対する薬理学的な反応の指標として客観的に測定・評価される項目」

[9]より参照

とされており、「デジタルバイオマーカーとは、デジタル技術を使った計測方法で取得されたバイオマーカーのことを指します。

 一方で、「エンドポイント」とは、

・治療行為の有効性を示すための評価項目のこと
・治療の目的に合っており、なおかつ、客観的に評価できる項目
・臨床試験における治療行為で本来求めたいアウトカムは、死亡率の低下、疾患の発症率の低下、QOLの向上、副作用の低減などであり、これらの評価項目は、真のエンドポイント(true endpoint)と呼ばれる

[9]より参照

 つまり、バイオマーカーに限らず、その臨床試験におけるアウトカムの有効性を示す要素・要因を指します。「デジタルエンドポイント」は、新しいデジタル技術を使った計測手法によって確立したエンドポイントということになります。
例えば、スマートフォンアプリのアクセス履歴などは、デジタルバイオマーカーではありませんが、アウトカムによっては、デジタルエンドポイントになり得ます[表1]。
 似ているようで異なる、混同しやすい言葉ですのでご注意ください。

「臨床試験の高コスト化」と「計測技術の進歩」

 人類には病気や病原体と闘ってきた長い歴史があります。結果として、世界的に医療水準が向上し、多くの疾病を治療できるようになりました。その結果、死亡に至るエンドポイントは、倫理的な問題も相まって比較的少なくなり、そのための臨床試験を実施するには高コストな実験が必要になってきています[2]。また、"6分間歩行試験"や"肺機能検査"などの多くの伝統的なバイオマーカー・エンドポイントは、(例えば、日本では)その国に一つしかない大病院に通うような必要はなく、近くの医療機関で簡単に計測することが可能になってきました。しかしながら、その計測方法では、疾病に対するスナップショット以上のものを捉えることはできません[3]。伝統的な手法に起因する課題はこれ以外にも多く存在します。
 
 一方で、デジタル技術とウェアラブル技術の進歩により、客観的なデータを、頻繁に、自宅で、個人レベルで計測することが容易にできるようになってきたため、この課題を解決する可能性が示唆されています[4]。
 しかし、このような可能性があるにもかかわらず、疾患のためのデジタルデータの測定や、その正確な価値の検証・利用はまだ不十分なのです。

デジタルエンドポイントの潜在的な利点

  臨床試験において、デジタルエンドポイントを利用することで、以下のような利点が得られると考えられています。

1.  臨床試験への参加率を高める

 デジタルエンドポイントは、測定を完全に自宅で行うことを可能にし、治験への参加率を高め、高齢者、精神科患者、子供などの慢性疾患を持つ方々が試験に参加することを可能にします。これらの患者層は、移動の困難、倫理的な障壁などから、従来は臨床研究において軽視されてきました。

2. 自然な環境での臨床試験の実現

 ウェアラブルデバイスを利用することによって、高頻度かつ状況に応じた測定が可能であり、臨床試験で用いられる人為的にデザインされた方法から脱却することができます。そのような自然な環境で患者様への介入効果を測定できるため、生態学的または「実世界(リアルワールド)」での妥当性が高まるという利点もあります。つまり、バイアスを除き、研究結果の正確性の向上にも繋がる可能性があるのです。

3. 従来の臨床試験をRe-Designすることができる

 標準化された測定方法や環境で被験者を完全にコントロールすることで成立する従来の臨床試験においては、すべての評価において直接の監視が必要です。しかし、従来の臨床試験とそのためのデータ収集に、これらのウェアラブルデバイスによる測定をデザインすることで、従来の試験デザインに実世界のデータが加わった、より新しい臨床試験を実現することができます。例えば、新規の評価項目がほぼ同じ、あるいは優れた価値を持つことが証明されれば、最終的には医療機関への訪問回数の削減や効率化につながるかもしれません。

デジタルエンドポイントの候補の選定方法

 デジタルバイオマーカーをはじめとするデジタルエンドポイントの候補は増え続けており、特定の臨床症状や疾患に対して正しいデジタルエンドポイントを選択することは困難です。いくつかのデジタルエンドポイントの候補を表1に記載していますが、優れた候補エンドポイントとは、正確で信頼性が高いものでなければなりません。したがって、個々の被験者にとって意味のあるアウトカム(例えば、睡眠、活動、痛み、移動能力、歩行)を直接測定するか、重要な臨床アウトカム(例えば、死亡率、病的状態、合併症の発生)と関連するものである必要があります[1]。
 また、デジタルエンドポイントを測定するデバイスを選択した場合でも、測定値を表示し、分析する適切な方法を選択することもまた困難です。例えば、一言に身体活動と言っても、歩数、中程度から激しい身体活動の持続時間、加速度計の1分あたりのカウント、平均歩行速度など、多くの尺度があります。また、それらのデータは連続性を持って記録されるため、スナップショット(クロスセクション)的なデータを解釈してきた従来の臨床試験のデータ分析とは、異なる見方で観察、分析する必要があるのです。

表1. [1]を参考に筆者作成

 では、どのような観点を持って、デジタルエンドポイントを選定していけば良いでしょうか。以下に、その観点を簡単に整理します。

技術的なバリデーションの観点

 新しい測定方法やその数値を使用する前に、扱いやすさ、信頼性、再現性、データの流れについてしっかりとした評価を行う必要があります。

1. 最小限の技術的基準を満たしているかどうか

 デバイスやそのデータの信頼性と一貫性を確認するには、デバイス間およびデバイス内のばらつきという形で評価する必要があります。そして、データフローは、データ(入力)エラーを減らすために、できるだけ手入力が必要ないように自動化されていることも必要です。また、フロー自体の一貫性と被験者のプライバシーが確保されたものでなければなりません(例えば、暗号化された送信を介するなど)[5]。さらに、新規の測定が、様々な現実の状況において、定量化しようとする行動、症状、活動を本当に捉えているかどうかを確認するために、患者以外の被験者を用いて分析を行う必要もあります。例えば、スマートフォンの加速度センサーは1日の歩数をカウントすることができますが、散歩に行くときにスマートフォンを机の上に置いたり、ロッカーやバッグ、ジャケットの中に入れたりする人がいるため、加速度センサーのカウントが低くなり、データだけを観察しても根本的な理由がわからないということがしばしばあります。そのような日常生活で起こりうるすべての状況を想定し、データで観測することはできませんが、限りなくそのバイアスを減らすための、データ収集及びデータの前処理などの技術水準が重要になってきます。

2. データの不一致に対する処理方法・対応方針

 新規測定法の技術的検証は、バリデーションプロセスにとって不可欠であり、もし議論の余地のない技術的ゴールドスタンダードとほぼ完璧に一致するのであれば、バリデーションプロセスはそこで終了するかもしれません。しかし、多くの場合、小型化プロセスに伴う技術的ノイズや測定バイアスが存在し、測定精度が損なわれる可能性があります。むしろ、汎用ウェアラブルデバイスと高精度医療機器との間には必ずと言っていいほど誤差は存在します。高精度な医療機器は、消費者向け機器と比較して技術的ノイズが少ない可能性が高い一方で、非常に高価で扱いにくいことが多いため、使いやすい消費者向けウェアラブルデバイスと比較して普及が制限されます[6]。さらに、技術的なノイズやバイアスの存在は必ずしも結果を決めつけるものではなく、欠損パターンがランダムに存在したり、バイアスを除くことができる場合は、臨床試験における治療効果の推定値を大きく変えることはありません[7]。
 在宅モニタリングの大きな利点は、データの解像度が非常に高くなり、従来のエンドポイントを上回る可能性が高いことです。今まで(物理的な近さ故に)目で見えてはいたが、客観的には観測できていなかったような事象が、データで観測できるようになるからです。この観点については、弊社の分析結果や医学論文における様々なスタディが存在するため、別記事で整理したいと思います。

3. 過度な(技術)要件は設定してしまってはいないか

 在宅モニタリングにつきものの理論的な測定誤差にこだわりすぎるのもよくないとされています。例えば、腕の反復運動など「歩数」に似ている可能性のある活動を実際の歩数と区別したり、デバイスが他の人に使用されないことを確認するための計画などです[8]。これらの要求は、技術的には確かに関連し得るが、臨床試験の文脈では無関係となる多くの理由があり得ると言われています。例えば、この不正確さが発生する条件が非常に稀である場合や、臨床状態の重症度との関連を測定する際に不正確さの影響が小さな場合です。データによってこれまで気がついていなかった細かな要求が無限に出て、迷路に迷い込みます。このような不要な追加要件は、実験を阻害する可能性がある落とし穴と言えます。そのような複雑なデータ構造を考慮した上で、本来解明したいアウトカムとエンドポイントとの関係を見失わないように臨床試験をデザインし続けるすることが、これまで以上に重要になってくるということです。難易度も高いかもしれません。

Decentralized Clinical Trial(分散型臨床試験)に向けて

 デジタルエンドポイントがもたらすメリットは、臨床試験の非中央化(Decentralized)へとつながり、被験者及び治験実施者がその恩恵を受けられますが、その扱いには探索的なプロセスが必要です。しかし、そのプロセスをデザインできた時、臨床試験の革新が起き、医療やヘルスケアが疾病を治療するだけでなく、Well-beingの改善も可能にし得ると考えます。

「2. 臨床的なバリデーションの観点」に関しては、別の記事(以下)で執筆しています。

弊社に関して

 弊社では、臨床試験のデジタル化、バイオマーカーの開発に向けたデータ収集・分析基盤をご用意しております。社内で蓄積された数々のスタディやノウハウなど、少しでもご興味を持っていただいた方は、お気軽にご連絡ください。

参考文献

[1] Kruizinga MD (2020) Development of Novel, Value-Based, Digital Endpoints for Clinical Trials: A Structured Approach Toward Fit-for-Purpose Validation The American Society for Pharmacology and Experimental Therapeutics.
[2] Kruizinga MD (2019) The future of clinical trial design: the transition from hard endpoints to value-based endpoints. Handb Exp Pharmacol 260:371–397.
[3] Steinhubl SR (2017) The digitised clinical trial. Lancet 390:2135.
[4] Babrak LM (2019) Traditional and digital biomarkers: two worlds apart? Digit Biomark 3:92–102.
[5] Angeletti F (2018) Towards an architecture to guarantee both data privacy and utility in the first phases of digital clinical trials. Sensors (Basel) 18:4175.
[6] Schrack JA (2016) Assessing daily physical activity in older adults: unraveling the complexity of monitors, measures, and methods. J Gerontol A Biol Sci Med Sci 71:1039–1048.
[7] Buyse M  (2017) The impact of data errors on the outcome of randomized clinical trials. Clin Trials 14:499–506.
[8] Papadopoulos E (2018) Request for qualification plan. FDA. DDT COA #000114.
[9] 薬学用語解説, https://www.pharm.or.jp/dictionary/wiki.cgi, 2023/03/13.


この記事が気に入ったらサポートをしてみませんか?