この動画は、AIの進化と大規模言語モデルの実装方法について掘り下げています。特に、健康問題の正確な診断を目指すHealth-LLMというアーキテクチャに焦点を当てています。Health-LLMは、83.3%の診断精度を実現し、GPT-3.5 Turboを上回っています。このアーキテクチャは、患者の症状を考慮して診断を行うための複合技術を利用していますが、完全な患者情報や遺伝情報を取り込むことができないという課題があります。
公開日:2024年2月3日
※動画を再生してから読むのがオススメです。
AIの領域は本当に盛り上がってきて、スピードを上げています。
新しい技術が出現し、あらゆる小さな隙間に組み込まれていく過程で、しばしば起こることの一つは、大きな進歩が小さな段階的な改善を本当に影に隠れさせてしまうことです。
これは、時間と空間を超えた技術全般に当てはまります。
以前の仮想化エンジニアとして、仮想化が大きな新しい輝かしい、セクシーなものだったことを覚えていますが、それはただの日常的なものになりました。
そして、AI、大規模言語モデルも同じフェーズを経ています。実際には、それらを実装する方法がますます見つかっています。
そして、これの具体的な内容は、輝かしさや興奮ほどではありません。
だから、今日は、この特定の研究が非常に興味深い理由について話すためにここにいるのです。それは、正確な診断を行うための認知アーキテクチャの確立されたベストプラクティスに向けて取り組んでいるからです。
この研究は、そのようなものの1つであり、ただし、これはアーカイブで発表されたものです。
それはプレプリントですが、非常に説得力があります。
要するに、Health-LLMは83.3%の診断精度を達成できたアーキテクチャです。
さまざまな技術を用いて、GPT-3.5 Turboや4を上回ることができました。
それでは、詳細な説明は省きますが、これがHealth-LLMの全体的なワークフローです。
したがって、情報検索とRAG(検索補完生成)の組み合わせを使用しています。
また、チャンキングやコンテキスト学習も行っています。
それはまた、特徴抽出と内部の質問応答を行い、患者の症例について本当に考えるためのものです。
これは、多くの要素からなるシリーズです。
このビデオを見ている方で、AIの分野にいる方は、これらの技術の多くに詳しいかもしれません。
しかし、これらの技術がすべて組み合わさったときに、特徴リストを生成し、意味埋め込みを使用し、シーケンス・トゥ・シーケンス・トランスフォーマーを使用し、従来の機械学習を使用すると、さまざまなことができます。
ここにはXGBoostもあります。
さまざまなことを行います。
では、私の簡単なバックストーリーについて説明します。
私の家族には多くの医師がいます。
私のおじは麻酔科医です。
義理の両親も医師です。
だから、キッチンテーブルの会話は診断プロセスです。
そして、一つのことは、私自身を含めて、医学の正確な診断に必要な要素を理解していない人々が、最近はあまり見かけないですが、多くの人々が、症状の一致だけではなく、実際には非常に難しいという誤解を持っていることです。
たとえば、Health MDやその他の症状チェッカーウェブサイトを利用したことがあるかもしれません。
そして、症状の一致だけでも、必要な情報の20〜50%かもしれません。
なぜなら、患者の経歴など、さまざまな要素もあるからです。
実際、実際の問題と誤検知を区別するのに役立つ反対指標があります。
これは、簡単な問題ではありません。
私は過去にプロジェクトを実証しました。
以前、医療受付フォームを作成しました。これは言語モデルを使用して反事実的な質問をすることができます。
しかし、これは少し違います。私が時間とエネルギー、焦点を持って取り組んだ場合、私はこれを進めていたでしょうが、私はADHDを持っています。
とにかく、彼らは医療データベースと医療アンケートを結びつけました。
これは、数ヶ月前に私が行った部分です。
そして、彼らはこれ以外のすべてを行いました。
話が脱線してしまってすみません。
この全体的なシステムは、実際の医療専門家が行うことの一部を近似しています。
医学校に行くことについて話すと、それはほとんど暗記です。
さまざまな体系や薬物、相互作用、方法などを覚えなければなりません。
そして、利用可能な診断プロセスと治療オプションをすべて覚えなければなりません。
この記憶の全てが、検索強化生成と情報検索が重要である理由です。なぜなら、私たち人間の脳は、非常に迅速に物事を思い出す能力を持っており、私たちの思い出しは、主に自分が置かれている状況に基づいて自動的に行われるからです。そのため、このプロセスが文脈を取り入れることが非常に重要なのです。
医療アンケートを取り入れます。
私は患者のチャートを取り込むということについては何も見ていません。
それが次のステップになるでしょう。
私はそれについて言及するものは見かけませんでした。
この研究は、患者の完全な診療記録などを摂取できるかどうかについてのものであり、他の研究でもこれを行っていることがわかっています。それは次のレベルになるでしょう。
とにかく、ここにアーキテクチャがあります。
それは非常に身近なことです。
患者の主訴や症状を特徴に分解する例があります。
そして、機械学習の観点で考えると、症状と診断、そして他の事実、例えば、不眠症があるかどうかなどといったことです。
彼らは十分に眠れていないのでしょうか?
他の状態はどうなっていますか?
また、関係のない症状や混乱を招く症状もあります。それが複数の問題を抱えている場合、診断がさらに困難になります。
それによって、診断がさらに難しくなることもあります。なぜなら、間違った推測に基づいて行動してしまうことがあるからです。
さて、長い話を短くすると、彼らは多くのテストを行いました。
このデータは、控えめに言っていますが、彼らは宿題をきちんとやって、点を打ち、Tを交差させました。
彼らは、このフレームワークが単にこれらのモデルを使用するだけよりもはるかに優れていることを実際に示すために、横並びの比較を行うさまざまな実験を行いました。
したがって、GPT-3.50の正確性は1/3でした。
それは世界で最も悪いことではありません、特に、まるで壁に湿ったスパゲッティを投げつけるように、いろいろな情報を投げつけるだけで、それがあなたの病気を正確に1/3の確率で診断できる場合には。
それは安価で速いモデルにとっては悪くありません。
GPT-4を使用して、少数の例示と情報検索を行ったとしても、精度は3分の2程度に過ぎなかったのです。
しかし、このシステムでは、問題を分解し、異なる視点から見るといういくつかのステップを追加した結果、正確な診断率は83.3%にまで向上しました。
これは明らかに医療機器として信頼性がある程度まで達しているわけではありませんが、そこに向かって進んでいます。
これは、まだLLaMA 3やGPT-5、より大きな文脈ウィンドウなどが存在しない段階での話です。
そして、私たちは正確で信頼性のある、迅速かつ安価な医学的診断能力に近づくにつれて、これらの重要な変化を目の当たりにしています。
もう一度言いますが、私は何も見ませんでした。見落とした可能性もありますが、これをかなり注意深く読みましたが、患者の全診療記録を取り込むことについては何も見当たりませんでした。
それに加えて、遺伝情報や家族歴など、患者の経歴に関する他の情報も追加されるでしょう。
そして、6〜12ヶ月以内に、90%、95%、または99%に近い正確な診断が見られることも驚くことではありません。
ただし、彼らのデータセットは61種類の異なる疾患のみでした。
実際には、数万種類の潜在的な診断が存在します。
例えば、ICD-10、11を見ると、17,000以上の可能な診断があり、そのうち多くは十分な検査方法が存在しないものもあります。
私自身も食事に関する問題を抱えているため、これらの多くの病気に対して血液検査はありません。
食事記録をつけることでしか問題を診断する方法はありません。
それがいくつかの問題を診断する唯一の方法です。
したがって、これらのことを実現するのはより困難になるでしょう。
実際、彼らのテストの一部は、検索の有無でこのシステムをテストしたということです。
検索なしでは、正確性が5%低下しました。
そして、彼らはこのアーキテクチャ、具体的なアーキテクチャ、およびこれらの手法が本当に異なる結果をもたらすことを非常によく示しました。
さて、昔の話を思い出してみてください。光学画像認識やRNN、CNNなどを行う際、1%の改善はかなり大きなものでしたが、私たちは20%の改善、5%の改善を得ています。
これは、大局的な観点から見れば、まだ比較的早い段階です。
全体的に、私はこの研究が非常に興味深く、またかなりの検証を行っていると考えています。なぜなら、私が数年間取り組んできた認知アーキテクチャのようなものだからです。
ただし、私はメッセージングとコミュニケーションに重点を置くことを選択しました。
しかし、これは私がこの問題に取り組む方法に非常に近いものです。
彼らはまた、私が思いつかなかったいくつかのアイデアも出しています。それが私がここにいる理由であり、それを伝える理由です。これらは本当に素晴らしいアイデアです。
ご視聴ありがとうございました。
この動画から多くのことを学んでいただけたら嬉しいです。
チャンネル登録やいいねをお願いします。
詳細は説明欄をご確認ください。
他のチャンネルへのリンクがたくさんあります。
また、私の仕事に共感を持っていただける場合は、ぜひパトロンに参加してください。
少しのサポートでも助かります。
さらに、独占的なDiscordコミュニティや月次ウェビナーにアクセスできます。
それでは、乾杯!