見出し画像

Babylon Healthとデジタルヘルスケア〜 Ⅳ. AI問診技術の現状とBabylon Healthの今

iCAREの山田です。今回がBabylon Healthについての最後になります。「Ⅲ. 急激な事業成長を遂げるアメリカ市場での展開(VBC)【前回】」についてはじまりを話ししました。

今回は
Ⅳ. AI問診技術の現状とBabylon Healthの今

について話をしていきます。

1.AI技術の時代の流れ

ヘルスケアにおけるAI関心への高まり

皆様もご存知のようにヘルスケア、医療業界においてAIを活用する機運は様々なところで起こっています。特に, 米国を中心に2016年から高まっていったようです。

Google Trend:2016年からトレンドが高まる


ヘルスケアでのAI活用の種類

  • 疾病の特定や早期発見 / (画像含む)診断

  • パーソナライズされた治療 / 行動変容

  • 創薬 / 開発、臨床治療研究

  • ロボット手術

  • 治療デザイン

様々な領域で活用されていたり、今なお研究が進んでいます。
Babylon Healthはこの中でもAI問診を英国NHSから進め、ルワンダ、米国VBCへと展開させた企業です。一部、AI問診の精度問題が指摘されているBabylon HealthのAI問診は、どのくらいのレベルだったのでしょうか。

2.AI問診の現状とエビデンス

 AI問診の2つのタイプ

AI問診と一言に言っても異なる目的があり、2015年の論文からは

① 診断を目的
② トリアージを目的(次のアクションを提案)
・緊急性あるもの
・緊急性ないもの
※ インテークのように診察前に症状を入力して、事前に電子カルテ上の医師の面談記録効率化をするようなものもありえます

2015年当時の23社の比較も掲載されています ※Babylon Healthはなし

でかなり精度が異なることがわかります。
診断を目的にすることよりもトリアージを目的にすることの方が、精度は高そうです。また診断においても、初回、鑑別診断5以内など様々な角度から捉えることができ、緊急性や重症度の高いものや非緊急性、セルフケアを中心としたものにおいても差があります。

第1診断でも30-40%レベル、緊急性の高いものは低くなっている、P値有意ではないが(2021年)

トリアージは、診断目的よりもある程度高く出ていると思います。

帰宅有無の判断は7割以上ということでしょうか

そして、トリアージにおける各社の比較がこちらになります。

各社バラバラな状況

このAI技術の領域はたった1年でも大きく変わることが予想されるため、最新の2023年で論文を探してみたのですが、、、

これでして、21,284の研究から14まで絞ったものでした。古いものは2014年から最新が2022年のオンライン症状チェックの研究です。

Both diagnostic accuracy and triage accuracy varied greatly among OSCs. Overall diagnostic accuracy was deemed to be low and was almost always lower than that of the comparator. Similarly, most of the studies (9/13, 69 %) showed suboptimal triage accuracy overall, with a few exceptions (4/13, 31%). The main variables affecting the levels of diagnostic and triage accuracy were the severity and urgency of the condition, the use of artificial intelligence algorithms, and demographic questions. However, the impact of each variable differed across tools and studies, making it difficult to draw any solid conclusions.
※ OSC: Online Symptom Checker、オンライン症状チェック

診断精度とトリアージ精度はOSCによって大きく異なっていた。全体的な診断精度は低く、ほとんどの場合比較対象よりも低かった。同様に、ほとんどの研究(9/13、69%)は、少数の例外(4/13、31%)を除き、全体としてトリアージ精度は最適ではなかった。診断精度とトリアージ精度のレベルに影響を与える主な変数は、病態の重症度と緊急度、人工知能アルゴリズムの使用、人口統計学的質問であった。しかし、各変数の影響はツールや研究によって異なっており、確実な結論を導き出すことは困難であった。

上記の紹介論文の結論部分から引用


4.Babylon Healthの今

さて4回にわたってBabylon Healthを追いかけてきて、数十の記事を英語で読んでまとめたのですが、肝心のBabylon Heatlhはなぜ一気に落ちていったのでしょうか。発表されているものからは推測しかできませんが、

  • 圧倒的な赤字体質

  • SPAC上場とその後の株価の低迷(上場から1年半で株価99%下落)

  • 資金援助や経緯統合の破談(Albacore Capital、MindMaze)

で結果的に資金ショートという流れと言われています。

米国2社が破産申請、ルワンダからも撤退、英国の事業もeMedへ売却となっています。

この記事によれば、創業者でCEOのAli Parsaは、いわゆる”Blitzscaling"にとらわれていたようです。私もこの事業成長あり方のReid Hoffmanの本を読みましたが、超急激なアントレプレナー的成長のモデルを紹介しているものです。

結果的に、同じことをやっているチームが3つあったり、新しく入社したマネージャーが何をしてよいかわからず彷徨っていたなどの声もあるように、凄まじい非効率性、高コスト体質であったことがわかります。

またAI技術を洗練させるスピード以上に、事業が急拡大していく中でエクセルで類似性を作っていただけのような品質であったことも証言しています。

2022年は、英国AIスタートアップSensyne Healthが13のNHSトラストとの契約を終了させ、IBMも同年ワトソンヘルスを米投資ファンドに売却、ヘルスケア自動化企業Olive AIは2023年に1/3を解雇にしたことも起こっており、AI技術をヘルスケアにおいてどう事業化するのか他社でも同様に悩み、苦しんでいることがわかります。


6.まとめと感想

Babylon Health の事業展開を英国、ルワンダ、米国と追いかけ、最後にAI問診技術についてまとめてみました。医療の難しさは、国によって、文化によってその価値観が異なるためシステムが大きく異なるという点です。さらにスタートアップの持つスピードと社会や患者の価値観との間のミスマッチも大きな課題になっていると言えます。

ここからは個人的な見解です。
Babylon Healthがもし、Blitz Scalingを最優先にせずTechnology を活用してOMO(Online merges with Offline)を実現させたのであれば凄いことになっていたはずだと思いました。特に、ルワンダでの展開は、うまくいっているような状況もあり、発展途上国における医療体制構築をすることでグローバルヘルスケアに貢献できたのではと思っています。
※ OMOで有名なの事業展開は、平和(ピンアン)ですね

一方で、画像におけるAIの素晴らしさがそのまま診断や問診、トリアージに活用されていくのかで言えば、現時点ではサービスごと、目的ごと、年度ごとでかなりバラつくため、常にエビデンスを意識した事業展開をせざるを得ません。ただこうしたエベデンスを意識した事業展開には、膨大なコストと時間がかかるため、急激な事業成長を目指すスタートアップには難しいかもしれません。

Babylon Healthを知ってみて、ここまでテクノロジーは来たんだという安心感とこれからはもっと上手に事業展開するスタートアップも色々出てきそうだという期待感もあります。ただし、一般的なスタートアップとは違い気候テックへの投資同様に、リターンの期間を長くするなどの対応をしないと事業成長ありきで地に足のついた価値提供が出来ないと懸念しています。Babylon Health ご馳走様でした。

※ 私は、AIや医療精度の専門家でもありませんので、もし間違いなどあれば是非ご連絡ください。


【計4話】Babylon Healthとデジタルヘルスケア〜
Ⅰ. イギリスNHSとともに事業のゼロイチを作り、基盤を構築
Ⅱ. アフリカを中心に発展途上国へ事業を展開
Ⅲ. 急激な事業成長を遂げる米国市場での展開(VBC)
Ⅳ. AI問診技術の現状とBabylon Healthの今


参考文献


この記事が気に入ったらサポートをしてみませんか?