医療AIにまつわる5つの神話

2023年5月31日 17:39

Googleの医療ケアチームの開発した医療AI（自動網膜病評価システム）の運用を通して得られた教訓が面白かったのでまとめてみました。

データは多ければ多いのほど良い？

現実：データの量はAIモデルの精度を向上させるのに重要だが、データの質の方がより重要である。訓練データは現実世界のデータの多様性（例えば患者の人口統計、現実の状況を反映したデータの質など）を反映するべきであり、専門家がそのような難しいケースで学習できるように判断することでラベル付けの質が向上する。

AIの専門家だけが必要？

現実：機能的な医療AIシステムを構築するには、臨床医、デザイナー、人間とコンピュータとのインタラクションの研究者、規制、倫理、法律の専門家など、多様なチームが必要である。

AIが高性能であることはすなわち臨床的に信頼できることを意味する？

現実：コントロールされた状況下でAIの性能を検証することは、それが実際のクリニックに導入された際に同じレベルの性能を発揮することを保証するものではない。AIの堅牢な性能とモデルの汎用性を確保するためには、実際の環境での慎重な検証が必要である。

AIは既存ワークフローに容易に適合する？

現実：人間を中心にAIを設計する必要があり、その逆はない。最良のAIの使用例は、元々の仮定とは異なる場合がある。また、AIをワークフローに追加することで、全体的な臨床プロセス、例えば患者教育や患者のスケジューリングの最適化などに予期せぬ調整が必要になることもある。

ローンチは成功を意味する？

現実：初期のローンチ後に患者の人口や環境要因が変わることがあり、これらの要因はAIの性能に予期せぬ影響を及ぼすことがある。AIの性能を積極的に監視するシステムを実装することで、早期に潜在的な問題を検出することができる。

所感

良いモデルを作ればそれでOK、ではなく、運用の中で持続的な改善と適用が必要という話で、そりゃそうだよなぁ、という感じでした。言語モデルでもファインチューニング用のデータは量より質と言われているので、じゃあその質はどう評価していくのか、というところが問われるなーと感じます。

現場からは以上です。

この記事が気に入ったらサポートをしてみませんか？