見出し画像

Towards Generalist Biomedical AI

1. 本研究の学術的背景,研究課題の核心をなす学術的「問い」は?
- 医学はテキスト、画像、ゲノムなど豊富なデータモダリティを持ち、多様性に富んでいる。総合的なバイオメディカル人工知能(AI)システムは、これらのデータを柔軟に符号化、統合、解釈することで、科学的発見から診療配信への重要な応用が可能となる。本研究では、多様な医療課題を対象とした一般的なバイオメディカルAIシステムの性能評価を目的として、新しいマルチモーダルバイオメディカルベンチマーク「MultiMedBench」を作成し、その訓練済みモデル「Med-PaLM M」の性能について検証を行った。

2. 本研究の目的及び学術的独自性と創造性は?
- 本研究の目的は、総合的なバイオメディカルAIシステムの開発に向けて、新しいマルチモーダルバイオメディカルベンチマーク「MultiMedBench」を作成し、その訓練済みモデル「Med-PaLM M」の性能を検証することである。本研究の独自性と創造性は、医療課題の多様性に対応するため、テキスト、画像、ゲノムなど豊富なデータモダリティを統合したシステムの構築にある。また、訓練済みモデルの性能評価には、多数の医療課題をカバーするマルチモーダルバイオメディカルベンチマーク「MultiMedBench」を使用し、従来の専門家によるモデルよりも高い性能を発揮した。

3. 本研究の着想に至った経緯や,関連する国内外の研究動向と本研究の位置づけは?
- 医療課題の多様性に対応するため、テキスト、画像、ゲノムなど豊富なデータモダリティを統合することは、バイオメディカルAI分野において重要な課題とされている。先行研究には、個々のデータモダリティに対する専門的なモデルが多く存在するが、複数のモダリティを統合的に扱うモデルは限られている。そのため、本研究ではこの課題に取り組み、マルチモーダルバイオメディカルベンチマーク「MultiMedBench」およびその訓練済みモデル「Med-PaLM M」の開発を行った。

4. 本研究で何をどのように,どこまで明らかにした?
- 本研究では、マルチモーダルバイオメディカルベンチマーク「MultiMedBench」を作成し、その訓練済みモデル「Med-PaLM M」の性能を評価した。具体的には、医療問い合わせ、乳房・皮膚画像解釈、放射線報告書の生成と要約、ゲノム変異呼び出しなど、14種類のさまざまなタスクについて、性能評価を行った。また、訓練済みモデルの予測結果について、複数の医師による評価を実施し、その有効性を評価した。

5. 本研究の有効性はどのように検証した?
- 本研究で作成したマルチモーダルバイオメディカルベンチマーク「MultiMedBench」により、訓練済みモデル「Med-PaLM M」の性能評価を行った。その結果、14種類の医療課題において、高い性能を発揮し、専門家によるモデルを大きく上回ることが示された。また、予測結果について複数の医師による評価も行い、実用可能性を検証した。

この記事が気に入ったらサポートをしてみませんか?