見出し画像

Recent medRxiv on Health Informatics: July 05, 2024

下記の文章は論文アブストラクトをもとに Retrieval-Augmented Language Modeling (RALM) により生成された文章であり、正確性は保証しません。

Question 1: 文脈として与えられた最新論文の内容を、背景、新規性、方法などに分けて、詳しく説明してください。

背景: 近年、人工知能(AI)が患者ケアの様々な側面に組み込まれるにつれて、その透明性と信頼性の確保に関する理解を深めることへの関心が高まっています。しかし、AIの使用の透明性を促進するために患者が必要とする情報については、あまり注意が払われていません。

方法: 我々は、AIの信頼と受容に関する情報ニーズについての観点を議論するために、アメリカ全土から42人の患者を対象に、3つの非同期オンラインフォーカスグループを実施しました。特に心血管ケアにおけるAIの使用に焦点を当てています。データは迅速な内容分析アプローチを用いて分析されました。

結果: 研究結果からは、患者にはAIモデル、監督、および医療経験に関する具体的な情報要因を含む一連の核となる情報ニーズが存在し、これらは信頼を調整する上で関連性があること、また情報提供、開示、同意、医師によるAIの使用に関する観点があることが示唆されました。

結論: 患者の情報ニーズを特定することは、医療AIシステムへの信頼を調整するための重要な出発点であり、情報提供戦略の設計にも不可欠です。これらの所見は、透明な医療AIアプローチを考慮する際に、患者中心のエンゲージメントの重要性を強調しています。

新規性: この研究は、特に心血管ケアにおけるAIの使用に焦点を当て、患者がAIを信頼し受け入れるためにどのような情報を必要としているかを明らかにしようとする試みです。これまでの研究では患者の情報ニーズにあまり注目されていなかったため、この研究はそのギャップを埋めるものです。

Patient information needs for transparent and trustworthy artificial intelligence in healthcare
Stroud, A. M., Minteer, S. A., Zhu, X., Ridgeway, J. L., Miller, J. E., Barry, B. A. 2024-07-03 http://medrxiv.org/cgi/content/short/2024.07.02.24309850v1

下記の文章は論文アブストラクトをもとに Retrieval-Augmented Language Modeling (RALM) により生成された文章であり、正確性は保証しません。

Question 2: 文脈として与えられた最新論文の内容を、背景、新規性、方法などに分けて、詳しく説明してください。

背景: 臨床データウェアハウス(CDW)の開発により、医療研究におけるビッグデータへのアクセスが大幅に増加しました。しかし、異なるデータモデル間での標準化が不足しているため、相互運用性が阻害され、これら広大なデータリソースの研究ポテンシャルが十分に発揮されていません。さらに、データの操作や分析には高度なプログラミングスキルが必要であり、これは多くの医療専門家が持ち合わせていないスキルセットです。

新規性: これらの問題に対処するために、我々はOMOP共通データモデルに基づいたオープンソースでローコードの協働的データサイエンスプラットフォームを作成しました。このプラットフォームは、グラフィカルツールと高度なプログラミングインターフェイスを併用して、医療データの操作、可視化、分析を行うことができます。

方法: このソフトウェアはLinkRと呼ばれ、複数のソースからインポートされたデータを使用して研究を生成する機能をユーザーに提供します。ソフトウェアは研究を個別データセクションと集団データセクションの2つの主要セクションに整理します。個別データセクションでは、ユーザーフレンドリーなグラフィカルツールを使用して、研究のニーズに応じて医療記録の同等物を再現し、データ表示をカスタマイズすることができます。集団データセクションは、グラフィカルおよびプログラミングインターフェイスを通じて統計分析を行うために設計されています。アプリケーションには、メッセージングページや統合されたGitモジュールなどの協働機能も組み込まれており、異なる研究センター間での効率的な協力と共有データ分析を促進します。

結論: LinkRは、臨床データウェアハウスからのデータへのアクセス、操作、分析を民主化し、オープンサイエンスのアプローチを使用して医療データの協働作業を容易にするローコードデータサイエンスプラットフォームです。

LinkR: an open source, low-code and collaborative data science platform for healthcare data analysis and visualization
Delange, B., Popoff, B., Seite, T., Lamer, A., Parrot, A. 2024-07-03 http://medrxiv.org/cgi/content/short/2024.07.03.24309872v1

下記の文章は論文アブストラクトをもとに Retrieval-Augmented Language Modeling (RALM) により生成された文章であり、正確性は保証しません。

Question 3: 文脈として与えられた最新論文の内容を、背景、新規性、方法などに分けて、詳しく説明してください。

この研究の背景として、自動医療コーディング(AMC)の精度と効率を向上させることが挙げられます。AMCは、医療記録から正確なICD-10-CMコードを割り当てることにより、医療管理の効果を高めるために不可欠です。しかし、診断記述のあいまいさや、長短の異なる記述間の意味的類似性を捉えることは、従来のモデルでは困難でした。

新規性としては、この研究では、最新の埋め込みモデルがICD-10-CMコードの意味的類似性をどの程度捉え、AMCの精度を向上させるかを評価しています。これまでにないアプローチとして、ClinicalBERTという専門化されたモデルと、text-embedding-3-large、text-embedding-004、voyage-large-2-instruct、mistral-embedという最新の汎用埋め込みモデルを比較しています。

方法としては、これらのモデルを使用して、eICUデータベースからの診断文字列とICD-10-CMコードの長短の記述間の意味的類似性を捉え、正しいICD-10-CMコードへのマッピングを改善するための検索プロセスを評価しました。これには、モデルが生成する埋め込みベクトルを利用し、類似度に基づいて最も近いICD-10-CMコードを検索する手法が含まれます。

結果として、text-embedding-3-largeとtext-embedding-004モデルがClinicalBERTを超える意味的類似性を捉えることに成功し、特にtext-embedding-3-largeが最も高い精度を達成しました。ICD-10コードの検索においては、voyage-large-2-instructモデルが最良のパフォーマンスを示しました。15個の最近傍を使用することで最も良い結果が得られ、それ以上の数を増やしても意味のある情報が不足しているため精度は向上しませんでした。

結論として、最新の埋め込みモデルは、AMCタスクにおいて専門化されたモデルであるClinicalBERTを大きく上回る性能を示しました。これらの結果は、診断記述のあいまいさにもかかわらず、これらのモデルが医療コーディング実践を強化する潜在能力を強調しています。

Enhancing Automated Medical Coding: Evaluating Embedding Models for ICD-10-CM Code Mapping
klotzman, v. 2024-07-03 http://medrxiv.org/cgi/content/short/2024.07.02.24309849v1

下記の文章は論文アブストラクトをもとに Retrieval-Augmented Language Modeling (RALM) により生成された文章であり、正確性は保証しません。

Question 4: 文脈として与えられた最新論文の内容を、背景、新規性、方法などに分けて、詳しく説明してください。

背景:
ヘルスリテラシーは、医療システムを効果的に利用し、健康に関する意思決定を行うために不可欠です。特に高齢者や経済的に制約を受ける層、教育水準が低い層では、ヘルスリテラシーの低さが負の健康結果と関連しています。バイオメディカルや臨床文書に見られる内容を簡略化するプレーンランゲージサマリー(PLS)は、一般の聴衆が健康関連文書を真に理解するためのギャップを埋める有効な手段です。しかし、バイオメディカルテキストをPLSに翻訳する作業は時間がかかり、困難であり、必要とする人々に十分にアクセスできるものではありませんでした。

新規性:
本研究では、自然言語処理(NLP)を用いてプレーンランゲージの識別を体系化し、さらに最先端の大規模言語モデル(LLM)、Generative Pre-trained Transformer(GPT)3.5およびGPT 4を使用して、バイオメディカルテキストからPLSを自動生成する能力を評価しました。これは、専門家によるPLS生成の自動化という点で大きな進歩を意味します。

方法:
研究では、まずテキストがプレーンランゲージで書かれているかどうかを識別するための分類モデルが開発され、高い精度(97.2%)を達成しました。次に、GPT 4という最新のLLMを使用して、バイオメディカルテキストからPLSを生成し、その結果をドメインの専門家が生成したPLSと比較しました。GPT 4によって生成されたPLSは、専門家によるものと意味的に同等であり、精度、読みやすさ、完全性、有用性の点で高く評価されました。

結論:
この研究の発見は、LLMとNLPを使用してバイオメディカルテキストをプレーンランゲージサマリーに翻訳する価値を示しており、患者や一般の聴衆が医療情報を理解し、情報に基づいた医療決定を行うための医療関係者の支援ツールとしての潜在的な使用可能性を示唆しています。

Bridging the Gap in Health Literacy: Harnessing the Power of Large Language Models to Generate Plain Language Summaries from Biomedical Texts
Salazar-Lara, C., Arias Russi, A. F., Manrique, R. 2024-07-03 http://medrxiv.org/cgi/content/short/2024.07.02.24309847v1

下記の文章は論文アブストラクトをもとに Retrieval-Augmented Language Modeling (RALM) により生成された文章であり、正確性は保証しません。

Question 5: 文脈として与えられた最新論文の内容を、背景、新規性、方法などに分けて、詳しく説明してください。

この最新論文は、アフリカの公衆衛生における自然言語処理(NLP)技術の現状と展望を探るためのスコーピングレビューです。以下に、背景、新規性、および方法に分けて詳細に説明します。

背景:
自然言語処理(NLP)は、テキスト分析や言語生成などのタスクを容易にするために、コンピュータが人間の言語を処理するための計算技術の範囲を研究する分野です。最近のNLPの進歩は、アクセシビリティ、パーソナライゼーション、タイムリネスを高めることによって、公衆衛生の提供を変革する大きな可能性を示しています。しかし、アフリカのコミュニティにおけるこれらの技術の応用は、特にヘルスケア分野における大規模でドメイン固有のデータセットの不足というデジタルリソースの限界によってしばしば制限されています。

新規性:
このレビューは、アフリカにおける公衆衛生のためのNLP技術のランドスケープを系統的に探ることを目的としています。利用可能な技術、その利用可能性に影響を与える要因、そして対処が必要なギャップを特定します。アフリカの公衆衛生設定におけるNLPアプリケーションの現状を示し、投資と開発が必要な重要な領域を特定するための結果と分析を提供することを目指しています。

方法:
このレビュープロトコルはPRISMA-Pステートメントに従って導かれます。検索戦略は、2013年から2024年にかけて、MEDLINE(PubMed経由)、ACLアンソロジー、Scopus、IEEE Xplor、ACMデジタルライブラリ、およびグレーリテラチャーに実行されます。選択された文献は、関連するデータを抽出し、分析するために検討されます。このプロセスにより、アフリカの公衆衛生におけるNLP技術の利用状況と、その発展における障壁や必要なリソースが明らかになります。

以上が与えられた文脈に基づく論文の内容です。アフリカにおける公衆衛生の分野でNLP技術がどのように利用されているか、そしてその展開に向けて何が必要かを明らかにすることが、この論文の主要な目的とされています。

Review Protocol: A Scoping Review of Natural Language Processing Technologies for Public Health in Africa
Hu, S., Oppong, A., Mogo, E., Barford, A., Occhini, G., Collins, C., Korhonen, A. 2024-07-03 http://medrxiv.org/cgi/content/short/2024.07.02.24309815v1

下記の文章は論文アブストラクトをもとに Retrieval-Augmented Language Modeling (RALM) により生成された文章であり、正確性は保証しません。

Question 6: 文脈として与えられた最新論文の内容を、背景、新規性、方法などに分けて、詳しく説明してください。

この最新の論文では、医学的な議論という観点から、科学的な成果の発表において、仮説や結果がどのように提示されるか、その手法について分析しています。特に、研究成果を伝える際に用いられる言語や構造がどのように偏りを持っているか、また、その背景、関連性、堅牢性、そして聴衆が当然のように受け入れるべき前提条件について異なる強調をどのように置いているかを検討しています。このような議論の分析は、社会人類学の分野では広く研究されていますが、実際の研究を行っている科学コミュニティ内では一般的に見過ごされがちです。

論文の背景では、医学的な機会の広範なスクリーンを考慮に入れた政策を策定するため、また、約束されたがあまり歩まれていない道を見落とさないため、さらには病気、治療法、患者、その他の利害関係者の異なるタイプの表現を理解し、これらの用語が時間、文化などによってどのように条件付けられているかを認識するために、議論の分析が重要であることを指摘しています。

新規性に関して、この研究では、リウマチ性関節炎に対して提供される治療法に関する医学的議論を、トピックモデリングと大規模言語モデルに基づく感情およびセンチメント分析を用いて補完的に分析するというアプローチを提案しています。これにより、従来の社会人類学者が行っていた手作業のキュレーション方法とは異なる、自動化された方法で広大で絶えず増大する医学文献を探索する新しい方法を提供しています。

方法については、トピックモデリングを用いて医学文献の中から主要なトピックを抽出し、それらのトピックがどのように時間や文化によって変化しているかを分析します。また、大規模言語モデルを活用した感情分析とセンチメント分析を通じて、治療法に対する感情や意見の傾向を評価します。これにより、医学的議論のより深い理解を目指し、その結果を医学政策や臨床実践に反映させることができるようになります。

Large-scale analysis of the medical discourse on rheumatoid arthritis: complementing a socio-anthropologic analysis
Santoro, M., Nardini, C. 2024-07-03 http://medrxiv.org/cgi/content/short/2024.07.02.24309823v1

下記の文章は論文アブストラクトをもとに Retrieval-Augmented Language Modeling (RALM) により生成された文章であり、正確性は保証しません。

Question 7: 文脈として与えられた最新論文の内容を、背景、新規性、方法などに分けて、詳しく説明してください。

背景:
ImportanceSpinは、研究結果を実際の客観的評価よりも肯定的に誤って表現する一般的なバイアス報告の形態です。これが精神医学のジャーナルにどの程度存在するかは、これまでよくわかっていませんでした。

新規性:
Objectiveこの研究の目的は、精神医学のジャーナルにおける薬理学的および非薬理学的介入に関するオリジナルレポートが、どの程度「スピン」を反映しているかを、大規模言語モデルを用いて特徴づけることです。

方法:
Designこの研究では、2013年から2023年の間に3つの高影響力のある精神医学のジャーナルに掲載された、介入を対象としたランダム化試験やメタアナリシスの研究の抄録を特定しました。

Main Outcome and Measureスピンの存在または非存在は、大規模言語モデル(GPT4-turbo, turbo-2024-04-09)を用いて推定され、スピンのある抄録とない抄録を用いた金標準で検証されました。

結果:
合計663の抄録のうち、296(44.6%)が可能性のあるまたはおそらくスピンを示していました。これには、529のランダム化試験のうち230(43.5%)、134のメタアナリシスのうち66(49.3%)、薬物に関する310のうち148(47.7%)、心理療法に関する238のうち107(45.0%)、その他の介入に関する115のうち41(35.7%)が含まれます。多変量ロジスティック回帰モデルによると、ランダム化試験の報告、非薬理学的/非心理療法介入、より最近の出版物は、スピンを示す可能性が低いことが示されています。

結論と関連性:
高影響力の精神医学のジャーナルに掲載された精神医療介入の抄録のかなりの割合が、潜在的に誤解を招く方法で結果が提示されている可能性があり、これは臨床実践に影響を与える可能性があります。大規模言語モデルを使用したスピン検出の自動化の成功は、将来の出版物でスピンを最小限に抑えるための識別と改訂を容易にするかもしれません。

Research Letter: Characterizing spin in psychiatric clinical research literature using large language models
Perlis, R. H. 2024-07-01 http://medrxiv.org/cgi/content/short/2024.06.30.24309737v1

下記の文章は論文アブストラクトをもとに Retrieval-Augmented Language Modeling (RALM) により生成された文章であり、正確性は保証しません。

Question 8: 文脈として与えられた最新論文の内容を、背景、新規性、方法などに分けて、詳しく説明してください。

背景:
臨床試験の成功には、適格な患者の募集が不可欠です。試験の選択基準に合致する患者を特定することは、試験の設計と結果に大きく影響します。しかし、選択基準の複雑さと患者データの多様性により、手動での分析は負担が大きく時間を要する作業です。

新規性:
本研究では、患者募集を自動化するために、Siamese Neural Network(シャムニューラルネットワーク)に基づくモデル「Siamese-PTM」を提案しています。Siamese-PTMは、事前訓練されたLLaMA 2モデルを使用して、電子健康記録(EHR)と基準入力の文脈表現を導き出し、二つの重み共有の同一サブネットワークを使用して共同でエンコードします。これにより、従来の手法に比べて効率と精度の向上が期待されます。

方法:
Siamese-PTMは、構造化されたEHRと非構造化EHRの両方において、それらの予測情報を単独および集合的な特徴セットとして分析するために評価されました。シャムニューラルネットワークのエンコーダーには様々な深層モデルが探求され、それらのパフォーマンスはシングルエンコーダーカウンターパートと比較されました。また、ベースラインとしてルールベースの分類器を開発し、Siamese-PTMはそのパフォーマンスを40%向上させたことが示されました。さらに、Siamese-PTMが学習した埋め込み空間の可視化により、その予測の堅牢性が強化されることが示されました。

結論として、Siamese-PTMは、臨床試験における患者募集の自動化という課題に対して、有効なアプローチを提供しており、従来の手法に比べて大幅なパフォーマンス向上を実現しています。

Matching Patients to Clinical Trials using LLaMA 2 Embeddings and Siamese Neural Network
Chowdhury, S., Rajaganapathy, S., Yu, Y., Tao, C., Vassilaki, M., Zong, N. 2024-06-30 http://medrxiv.org/cgi/content/short/2024.06.28.24309677v1

下記の文章は論文アブストラクトをもとに Retrieval-Augmented Language Modeling (RALM) により生成された文章であり、正確性は保証しません。

Question 9: 文脈として与えられた最新論文の内容を、背景、新規性、方法などに分けて、詳しく説明してください。

背景:
安全で効率的な臨床実践には効果的なコミュニケーションが不可欠です。コミュニケーションの失敗は、エラーや誤診、不適切な治療、そして貧弱なケアに繋がります。また、コミュニケーションのエラーはセンチネルイベントに寄与し、医療システムの苦情の根本的な要因となっています。

フォーマルな臨床コミュニケーション(FCC)ツール、例えばISBARは患者のアウトカムを改善します。FCCのガバナンスはますます電子カルテ(EMR)を中心に構築されていますが、多くの非公式な臨床コミュニケーション(ICC)はEMRの外で行われています。

ICCには、ポケベル、ショートメッセージサービス(SMS)テキスト、暗号化されたメッセージングアプリ、電話、地元の無線ネットワーク(例:Vocera)など、さまざまなプラットフォームが含まれます。ICCの臨床記録の文書化は低品質であり、容易には定期的に監査されません。個人のアイデンティティに基づくICCは、正確なロースターや交換手、二次リストに依存しています。適切な役割に迅速かつ容易に連絡が取れない場合、重大な非効率性と潜在的な臨床リスクが発生する可能性があります。

地域の問題:
2019年にオースティン・ヘルスは、ICCプロセスを国家標準のFCCに対して臨床ガバナンス評価を実施しました。2020年にICCのさらなる調査とプロセスマッピングが行われました。これは、ICCの慣行を統治するための関連するポリシーと手順の不足を示し、非常に変動が大きく複雑なプロセスであることを示しました。

目的:

  • 臨床および/または管理スタッフ間の非公式コミュニケーションで使用される技術を文書化する。

  • 現在のコミュニケーション方法がスタッフに与える自己認識された影響を文書化する。

  • 現在のコミュニケーション方法が効率と安全性に与える可能性のある自己認識された影響を文書化する。

  • 組織の非公式コミュニケーション改善における検討すべき主要な要因を特定する。

方法:
多職種のオンラインスタッフ横断調査をMicrosoft Formsを使用して実施しました。この調査は、使用中の非公式コミュニケーション方法の範囲を確認し、現在の多様なコミュニケーション技術の問題とそれに内在するリスクの認識を特定することを目的としています。

結果:
115人の自己選択的な臨床および管理スタッフが調査に回答しました。複数のコミュニケーションチャネルが使用されています。回答者は高いレベルのフラストレーション、遅延、中断、非効率を指摘しました。望ましいコミュニケーションの改善と使用の考慮事項が特定されました。調査結果は、既存のICCフレームワークの臨床ガバナンス評価を検証し、技術改革の必要性を裏付けました。

結論:
ICCのガバナンス標準には、地域レベルと広範囲なレベルの両方でギャップがあります。技術プラットフォームへの順次追加により、高リスクのコミュニケーション環境が作り出されました。効率の悪さ、遅延、フラストレーション、および患者の安全リスクの高いレベルについてのスタッフの認識は、職種を越えて一貫していました。この作業は、非公式臨床コミュニケーションに特化したエンタープライズプラットフォームの開発を後押ししました。

キーメッセージ要約ボックス:

  • 既に知られているトピック: 不十分なコミュニケーション実践は患者ケアの予防可能なエラーや有害事象に寄与します。ISBARなどの構造化された引継ぎツールの使用は、フォーマルな臨床コミュニケーションを改善するための枠組みを提供します。現在の多様なコミュニケーション技術は、非公式臨床コミュニケーションにおいて中断的で非効率的であり、スタッフのフラストレーションを増大させ、患者に害を及ぼす可能性があります。

  • この研究が追加するもの: 我々は、既存の多様なコミュニケーション技術によるフラストレーション、時間の浪費、および患者に対する害の可能性に関するスタッフの印象を記述し、非公式コミュニケーションポリシーの強化のための枠組みを提供します。

  • この研究が研究、実践、政策に与える影響: これらの発見は、非公式臨床コミュニケーションのためのガバナンス標準の要求を提供します。我々は、コミュニケーションの複雑さを減らすために多様なコミュニケーション技術の合理化の必要性を強調し、新しい技術に対するいくつかの主要な機能要件を特定します。

Technology Based Challenges of Informal Clinical Communication in an Australian tertiary referral hospital : A mixed methods assessment of The Need for Change.
Hart, G. K., Hosking, N., Martin, L., Todd, J. 2024-06-28 http://medrxiv.org/cgi/content/short/2024.06.26.24308798v1

下記の文章は論文アブストラクトをもとに Retrieval-Augmented Language Modeling (RALM) により生成された文章であり、正確性は保証しません。

Question 10: 文脈として与えられた最新論文の内容を、背景、新規性、方法などに分けて、詳しく説明してください。

背景:
これまでの生物医学データエコシステムは断片化しており、異なる研究分野やデータソースが統合されていない状態でした。しかし、FAIR(Findable, Accessible, Interoperable, Reusable)データ原則の下での調和に向けて動き出し、クラウドベースの研究のための新しい機会が生まれています。これは、大規模で多様なデータセットに対して創造的で非標準的な計算分析パイプラインを実装したいと考えている様々な分野の科学者にとって特に好機です。

新規性:
本論文では、CAVATICAというクラウドコンピュートプラットフォームを利用して、カスタムワークフローを開発するアクセスしやすく、簡素化されたアプローチを提案しています。特に、先天性の口唇顎裂リスクに性特異的な遺伝子効果を検出するために、ケース・ペアレントの三人組の全ゲノムシーケンスを分析するためのカスタムワークフローの開発について説明しています。これは、複数のプログラミング言語やカスタムソフトウェアパッケージを必要とする複雑な作業です。

方法:
提案されたアプローチは3つのコンポーネントから成り立っています。第一に、Dockerを使用してソフトウェア環境をコンテナ化し、第二に、各解析ステップのためのツール作成、第三に、これらのツールをCommon Workflow Language (CWL)パイプラインに組み合わせるための視覚的ワークフローエディタを使用します。このアプローチは基本的な計算スキルを持つ研究者であればアクセス可能であり、クラウド内での任意のスケーラブルなハイスループット生物医学データ解析を実装するために容易に拡張可能です。また、BioData Catalystなどの他の一般的に使用されているコンピュートプラットフォームにも適用可能です。

このアプローチは、データの多用途な再利用を促進し、FAIRデータの大幅な増加という時代において、生物医学的発見を加速することを目指しています。

Custom Biomedical FAIR Data Analysis in the Cloud Using CAVATICA
Berke, S. R., Kanchan, K., Marazita, M. L., Tobin, E., Ruczinski, I. 2024-06-28 http://medrxiv.org/cgi/content/short/2024.06.27.24309340v1

下記の文章は論文アブストラクトをもとに Retrieval-Augmented Language Modeling (RALM) により生成された文章であり、正確性は保証しません。

Question 11: 文脈として与えられた最新論文の内容を、背景、新規性、方法などに分けて、詳しく説明してください。

背景:
近年、人工知能(AI)の開発ペースは急速に進んでいますが、安全かつ効果的な規制フレームワークの実装は遅れがちです。特に、AIモデルの適応性は、モデルの更新がパフォーマンス向上に寄与する一方で、安全性リスクを導入する可能性もあるため、規制当局にとって独特の挑戦を提示しています。米国の食品医薬品局(FDA)は、数百に及ぶAI医療機器の規制と承認において先駆者的役割を果たしています。

新規性:
この研究では、FDAによって承認されたAI医療機器の更新の頻度と性質を体系的に分析し、AIがどのように更新されるか、その規制上の考慮事項をよりよく理解することを目指しています。これまでの研究では、AIデバイスの更新に関する包括的な分析はあまり行われておらず、本研究はそのギャップを埋めることを目指しています。

方法:
FDA承認のAI医療機器に関する公開データを収集し、デバイスが新しいデータで再トレーニングされて更新された割合、新機能やマーケティングクレームの形で報告された更新の割合などを分析しました。具体的なケーススタディとして、肺気胸検出モデルを分析し、新しいサイトで評価した際のモデル性能の低下と、サイト特有のデータでの再トレーニングによる性能低下の緩和、そして新しいサイトのデータを使用した再トレーニング後の元のサイトでの性能低下を観察しました。

結果:
全デバイスの2%未満が新しいデータで再トレーニングされて更新されたと報告しています。一方で、約四分の一のデバイスが新機能やマーケティングクレームの形で更新を報告しています。肺気胸検出モデルのケーススタディでは、新しいサイトでの評価によるモデル性能の低下が0.18 AUCに達することがわかりましたが、サイト特有のデータでの再トレーニングによって0.23 AUCまで性能が回復することも明らかになりました。しかし、新しいサイトのデータを使用した再トレーニング後に元のサイトでの性能が大きく低下することも観察され、現在のワンモデルフィットオールのアプローチに対する課題を示しています。

この分析は、FDA承認のAIデバイスの更新の現状と、モデル更新と適応的AIに向けた将来の規制ポリシーに対する洞察を提供します。また、この研究で使用されたデータとコードは、FDAのウェブサイトを通じて公開されており、補足資料として用いられた分析とコードはGitHubで公開予定です。

Regulating AI Adaptation: An Analysis of AI Medical Device Updates
Wu, K., Wu, E., Rodolfa, K., Ho, D. E., Zou, J. 2024-06-28 http://medrxiv.org/cgi/content/short/2024.06.26.24309506v1

下記の文章は論文アブストラクトをもとに Retrieval-Augmented Language Modeling (RALM) により生成された文章であり、正確性は保証しません。

Question 12: 文脈として与えられた最新論文の内容を、背景、新規性、方法などに分けて、詳しく説明してください。

背景:
電子健康記録(EHR)における多ラベル分類は、テキストデータに固有の意味的複雑さにより困難を伴います。大規模言語モデル(LLMs)を用いた自然言語処理(NLP)の進歩が、これらの問題に対処する可能性を示しています。実際の臨床環境でEHR分類に最も効果的な機械学習方法を特定することが重要です。

新規性:
本研究は、パラメータ効率の良いファインチューニング(PEFT)を用いたLLMsを使用すること、および使用しないことで、ゼロショット学習と少数ショット学習のプロンプト戦略がEHRデータセットの多ラベル分類に与える効果を検証することを目的としています。これにより、PEFTを用いたLLMsの効果と、ゼロショットおよび少数ショット学習の組み合わせが臨床タスクにおける分類性能に与える影響を明らかにしようとしています。

方法:
研究では、介護施設(RACFs)から得られた非構造化のEHRデータを使用し、Llama 2-Chatという13Bパラメータを持つ生成型AIベースの大規模言語モデル(LLM)を採用しています。評価は、精度、適合率、再現率、F1スコアを含み、非パラメトリック統計分析によってサポートされます。テストされたラベルは、認知症における興奮、認知症におけるうつ病、フレイル指数、栄養不良リスク要因の4つの臨床分類タスクにわたります。

結果:
実験結果は、ゼロショット学習と少数ショット学習の間で、同じプロンプトテンプレートを使用した場合に同じレベルの性能が得られることを示しています。PEFTなしでは、少数ショット学習がゼロショット学習よりも優れていました。また、ゼロショットおよび少数ショット学習と組み合わせたファインチューニングの有効性が大幅に向上することが強調されています。PEFT後のゼロショット学習の性能は、少数ショット学習と同じレベルに達しました。分析は、特定の臨床タスクのためのPEFTを備えたLLMsが、多様な臨床タスクにわたってその性能を維持することを強調しています。

これらの発見は、臨床文書分析においてLLMsを活用する研究者、実践者、関係者にとって重要な洞察を提供します。

Evaluating machine learning approaches for multi-label classification of unstructured electronic health records with a generative large language model
Vithanage, D., Deng, C., Wang, L., Yin, M., Alkhalaf, M., Zhang, Z., Zhu, Y., Soewargo, A. C., Yu, P. 2024-06-27 http://medrxiv.org/cgi/content/short/2024.06.24.24309441v1

下記の文章は論文アブストラクトをもとに Retrieval-Augmented Language Modeling (RALM) により生成された文章であり、正確性は保証しません。

Question 13: 文脈として与えられた最新論文の内容を、背景、新規性、方法などに分けて、詳しく説明してください。

背景:
冠動脈疾患(CAD)は、世界中で死亡原因の第3位となっており、CAD患者の死亡リスクは非常に高いです。しかし、CAD患者の死亡予測に関する研究はまだ十分ではなく、患者の死亡予測の精度を向上させるための予測モデリングが求められています。

新規性:
本論文では、CAD患者の死亡予測の精度を向上させるための新たなフレームワークを提案しています。このフレームワークは、心不全でICUに入院した患者の30日以内の再入院予測に使われた手法を改良したものです。提案されたフレームワークは、従来のベースライン機械学習モデルと比較して、ニューラルネットワーク(NN)モデルでROC曲線下面積(AUC)スコア0.871という優れた性能を示しています。

方法:
このフレームワークは、患者の医療歴、関連する時間変数、患者の人口統計情報を使用して死亡予測を行います。これにより、CAD患者に対する治療やケアのためのより正確な意思決定を医療チームが行うことができるようになり、患者の平均余命を延ばす可能性があります。

要約すると、本論文は、CAD患者の死亡予測の精度を高めるための新しい予測フレームワークを提案し、その有効性をニューラルネットワークモデルの高いAUCスコアを通じて実証しています。これは、患者の医療歴や人口統計情報を含む複数のデータポイントを組み合わせることで、医療提供者がより適切な治療選択を行うための助けとなることが期待されます。

Process Mining/ Deep Learning Model to Predict Mortality in Coronary Artery Disease Patients
Ashrafi, N., Abdollahi, A., Placencia, G., Pishgar, M. 2024-06-27 http://medrxiv.org/cgi/content/short/2024.06.26.24309553v1

下記の文章は論文アブストラクトをもとに Retrieval-Augmented Language Modeling (RALM) により生成された文章であり、正確性は保証しません。

Question 14: 文脈として与えられた最新論文の内容を、背景、新規性、方法などに分けて、詳しく説明してください。

この最新の論文は、筋萎縮性側索硬化症(ALS)の早期発見と病状の進行追跡の難しさに焦点を当てています。ALSは進行性の神経変性疾患であり、特に言語や運動機能に重大な影響を及ぼします。

背景:
ALSの進行をモニタリングする現在のゴールドスタンダードであるALS機能評価尺度改訂版(ALSFRS-R)は、症状の重症度に基づく主観的な評価に依存しています。しかし、この評価方法では微妙ながら臨床的に意味のある変化を捉えられない可能性があります。これは、ALSFRS-Rが細かな詳細まで評価できるほどの粒度を持っていないためです。

新規性:
この研究では、リモート患者モニタリングプラットフォームを通じて収集される多様な音声測定値(マルチモーダル音声測定値)の有効性を探究しています。これらの測定値は連続値であり、そのためALSの進行をより粒度の細かいレベルで捉える可能性があります。

方法:
研究では278名の参加者から音声とビデオを録音し、そのデータから自動的に多様な音声バイオマーカー(音響的、口顔面的、言語的)を抽出しました。特に、標準的な誘発に対するALS患者(pALS)の音声のタイミングの整合性と、絵を説明するために使用される単語の数が、バルバー発症(n=36)と非バルバー発症(n=107)の両方のpALSにおいて、病状の変化を検出する上で最も反応性が高いという結果を見つけました。興味深いことに、これらの測定値の反応性は小さなサンプルサイズでも安定していました。さらに、ある音声測定値は、患者が報告する臨床的な変化がない、つまりALSFRS-Rの音声スコアが4点満点中3点で変わらない場合でも、バルバー機能の低下を追跡するのに十分な感度を持っていることが分かりました。

研究の結果は、より改善され、加速され、費用効果の高い臨床試験やケアを促進する可能性を持っています。これにより、ALSの進行をより正確に追跡し、患者の状態に合わせた治療法の提供が可能になることが期待されます。

Multimodal Speech Biomarkers for Remote Monitoring of ALS Disease Progression
Neumann, M., Kothare, H., Ramanarayanan, V. 2024-06-27 http://medrxiv.org/cgi/content/short/2024.06.26.24308811v1

下記の文章は論文アブストラクトをもとに Retrieval-Augmented Language Modeling (RALM) により生成された文章であり、正確性は保証しません。

Question 15: 文脈として与えられた最新論文の内容を、背景、新規性、方法などに分けて、詳しく説明してください。

背景:
手術後の転倒は、患者と社会に重大な影響を及ぼしますが、その特定と追跡は依然として困難です。特に高齢者の患者ケアを改善し、医療費を削減するためには、手術後の転倒の検出が重要です。

新規性:
本研究では、臨床ノートにおける非構造化データを使用して手術後の転倒を信頼性高く自動で検出するための、大規模言語モデル(LLMs)の可能性に焦点を当てています。これまでにないアプローチとして、複数のオープンソースLLMsを用いて、異なる二つの医療システムにおいて手術後の転倒検出に関するいくつかのプロンプト手法をテストしました。

方法:
研究では、スタンフォードヘルスケアと退役軍人保健管理局(Veterans Health Administration)の二つの異なる医療システムにおいて、三つのオープンソースのLLMsを使用し、手術後の転倒検出に対するいくつかのプロンプト手法を試しました。特に「Mixtral-8x7B zero-shot」という手法が最も優れた性能を示しました。

結果:
スタンフォードヘルスケアでは、Mixtral-8x7B zero-shotがPPV(陽性的中率)= 0.81、リコール(再現率)= 0.67の結果を、退役軍人保健管理局ではPPV = 0.93、リコール = 0.94の結果を示しました。これらの結果から、LLMsはほとんど、または全くガイダンスなしで転倒を検出できることが示され、多くの異なる設定での転倒予測と予防にLLMsを応用するための基盤が築かれました。

Improving postsurgical fall detection for older Americans using LLM-driven analysis of clinical narratives
Pillai, M., Blumke, T. L., Studnia, J., Wang, Y., Veigulis, Z. P., Ware, A. D., Hoover, P. J., Carroll, I. R., Humphreys, K., Osborne, T. F., Asch, S. M., Hernandez-Boussard, T., Curtin, C. M. 2024-06-26 http://medrxiv.org/cgi/content/short/2024.06.25.24309480v1

下記の文章は論文アブストラクトをもとに Retrieval-Augmented Language Modeling (RALM) により生成された文章であり、正確性は保証しません。

Question 16: 文脈として与えられた最新論文の内容を、背景、新規性、方法などに分けて、詳しく説明してください。

2020年のCOVID-19パンデミックの発生以来、COVID感染の長期的な影響に焦点を当てた多くの研究が行われています。アメリカ疾病予防管理センター(CDC)は、2021年10月1日から有効な国際疾病分類第10版臨床改訂版(ICD-10-CM)に「Post COVID-19 condition, unspecified(U09.9)」という追加コードを実装しました。これは、ロングCOVIDが潜在的な慢性状態を持つ実際の疾患であることを示しています。National COVID Cohort Collaborative(N3C)は、アメリカ合衆国内の異なる臨床機関を横断して電子健康記録(EHR)データを集約し、調和させることにより、研究者に豊富なEHRデータを提供しており、これにより大量のCOVID陽性患者の中でロングCOVID患者と非ロングCOVID患者の生存分析を構築することが便利になっています。

背景:
COVID-19は世界的な健康危機を引き起こし、多くの人々が感染後も長期にわたる健康問題、いわゆるロングCOVIDに苦しんでいます。これに対処するためには、ロングCOVIDの実態を理解し、適切な医療対応を行う必要があります。CDCの新しいコード導入は、この状態の認識と記録を改善する一歩です。

新規性:
本研究は、N3Cが提供する大規模なEHRデータを用いて、ロングCOVID患者と非ロングCOVID患者の生存分析を行うことに特徴があります。これにより、ロングCOVIDの影響をより深く理解し、治療や予防策の開発に役立てることが期待されます。

方法:
研究では、N3Cのデータベースから得られたEHRデータを利用して、COVID-19に感染した患者の中でロングCOVIDの症状を呈する患者群とそうでない患者群を比較します。生存分析は、両群の健康状態や生存期間を統計的に評価するために用いられます。これにより、ロングCOVIDの影響やリスク要因を特定し、将来的な治療法や公衆衛生介入のための貴重な情報を提供することを目指しています。

A Bayesian Survival Analysis on Long COVID and non Long COVID patients: A Cohort Study Using National COVID Cohort Collaborative (N3C) Data
Jiang, S., Loomba, J., Zhou, A., Sharma, S., Sengupta, S., Liu, J., Brown, D. E. 2024-06-25 http://medrxiv.org/cgi/content/short/2024.06.25.24309478v1

下記の文章は論文アブストラクトをもとに Retrieval-Augmented Language Modeling (RALM) により生成された文章であり、正確性は保証しません。

Question 17: 文脈として与えられた最新論文の内容を、背景、新規性、方法などに分けて、詳しく説明してください。

背景:
心不全は世界中で数百万人の人々に影響を及ぼし、生活の質を大幅に低下させ、高い死亡率と関連しています。多くの研究が行われているにも関わらず、集中治療室(ICU)患者の心不全と死亡率の統計的関連性は十分には探求されておらず、予測モデルの改善が必要であるとされています。

新規性:
本研究では、ICD-9コードを使用してMIMIC-IIIデータベースから18歳以上の1,177人の患者を特定しました。これまでの研究では見過ごされがちだったICU患者の心不全による入院中の死亡率予測を、より精度高く行うための新しいモデルを提案しています。

方法:
データの前処理には、欠損データの処理、重複の削除、歪みの処理、データ不均衡の緩和のためのオーバーサンプリングが含まれます。LightGBMモデル内で18の特徴が選択され、分散インフレーションファクター(VIF)値、LASSO回帰、および単変量分析をチェックすることによって行われました。最終的なLASSOロジスティック回帰モデルの出力は、他の基準モデル(ロジスティック回帰、ランダムフォレスト、LightGBM、サポートベクターマシン(SVM)、決定木)と比較して、最高のテストAUC-ROCが0.8766(95%CI 0.8065 - 0.9429)であり、精度は0.7291でした。すべてのモデルは良好な校正を示し、比較的低いブライアスコアで信頼性の高い入院中死亡率の予測が可能であることを強調しました。

本モデルは、改善された代入戦略を通じた欠損値の前処理と、拡張された文献検索と鍵となる特徴の選択における改善された経験に基づく改善された特徴選択に基づいています。グリッドサーチを用いてほぼ完璧な予測モデルを構築しました。これらの方法は、心不全でICUに入院している患者の入院中の死亡率の予測精度を大幅に向上させました。

Prediction of In-Hospital Mortality for ICU Patients with Heart Failure
Zhang, J., Li, H., Ashrafi, N., Yu, Z., Placencia, G., Pishgar, M. 2024-06-25 http://medrxiv.org/cgi/content/short/2024.06.25.24309448v1

下記の文章は論文アブストラクトをもとに Retrieval-Augmented Language Modeling (RALM) により生成された文章であり、正確性は保証しません。

Question 18: 文脈として与えられた最新論文の内容を、背景、新規性、方法などに分けて、詳しく説明してください。

背景:
退院日の予測は、効率的な資源配分や患者ケア計画を可能にするため、医療管理において重要な役割を果たします。退院日の正確な推定は、病院の運営を最適化し、より良い患者の結果を促進することができます。

新規性:
本研究では、退院日予測モデルを開発するための体系的なアプローチを用いました。臨床の専門家と密接に協力して、予測の精度に寄与する関連データ要素を特定しました。構造化および非構造化データソースから予測特徴を抽出するために特徴工学が使用されました。予測タスクには、強力な機械学習アルゴリズムであるXGBoostが使用されました。さらに、開発されたモデルは広く使用されている電子医療記録(EMR)システムにシームレスに統合され、実用的な使いやすさを保証しました。

方法:
研究では、予測モデルを開発するために、関連データ要素の特定、特徴工学による予測特徴の抽出、XGBoostアルゴリズムの使用といった体系的アプローチが採用されました。また、モデルはEMRシステムに統合され、実際の臨床現場での使用が可能となりました。

結果:
モデルは、F1スコアでベースライン推定値を最大35.68%上回る性能を達成しました。展開後、モデルはMS GMLOSとの調和を示し、余分な病院滞在日数を18.96%削減することで運用価値を実証しました。

結論:
開発された退院日予測モデルの有効性と臨床実践における潜在的価値が、私たちの調査結果によって強調されました。退院日推定の精度を向上させることにより、モデルは医療資源管理と患者ケア計画を強化する可能性を持っています。今後の研究取り組みでは、多様なシナリオにおけるモデルの長期適用性の評価と、患者の結果に対するその影響の包括的な分析を優先するべきです。

Development and Validation of a Machine Learning Model Integrated with the Clinical Workflow for Inpatient Discharge Date Prediction
Mahyoub, M. A., Dougherty, K., Yadav, R., Berio-Dorta, R., Shukla, A. 2024-06-25 http://medrxiv.org/cgi/content/short/2024.06.24.24309419v1

下記の文章は論文アブストラクトをもとに Retrieval-Augmented Language Modeling (RALM) により生成された文章であり、正確性は保証しません。

Question 19: 文脈として与えられた最新論文の内容を、背景、新規性、方法などに分けて、詳しく説明してください。

背景:
強度変調放射線治療(IMRT)は、最も重要な現代の放射線治療技術の一つであり、しばしば最適化問題としてモデリングされます。目的関数と制約は、異なる臨床環境に設計された複数の臨床要件から成り立っています。厳格に制約された最適化問題が解を持たない場合、プランナーは経験的に特定の制約パラメータを緩和し、より満足のいく解が得られるまで問題を再解決することがあります。このプロセスは時間がかかり、労力を要します。いくつかの逆計画研究が自動放射線治療計画スキームに専念しています。

新規性:
この研究では、ディープ強化学習の枠組み内で、DVH(線量体積ヒストグラム)機能に基づく埋め込み層を設計し、DVHの有効な情報を直接抽出し、異なる臓器が戦略的ネットワークを共有できるようにすることで、2つの重要な欠点に対処しています:1) 各臓器に対してサブネットワークを設計することで、異なる臓器の数を持つ他の患者へのモデルの拡張が困難になる。臨床的には、同じ種類のがんであっても、放射線治療の対象となる臓器の数が異なる患者が一般的です。2) 低信号対雑音比のDVH曲線を強化学習ネットワークに直接状態として供給することで、その機能的特性を無視し、訓練効率が低下する。

方法:
提案されたモデルは、DVH曲線の効果的な情報を抽出するために、DVH機能に基づく埋め込み層を使用します。このようにして、異なる臓器が同じ戦略的ネットワークを共有し、モデルを他の患者に拡張する際の困難さを克服します。また、このアプローチはDVHの機能的特性を考慮に入れ、訓練効率を向上させます。135人の子宮頸がん患者のデータセットに対するテスト結果は、提案されたモデルが実世界の放射線治療計画に適用可能であることを示しています。

Automatic radiotherapy treatment planning with deep functional reinforcement learning
Liu, B., Liu, Y., Li, Z., Xiao, J., Lin, H. 2024-06-24 http://medrxiv.org/cgi/content/short/2024.06.23.24309060v1

下記の文章は論文アブストラクトをもとに Retrieval-Augmented Language Modeling (RALM) により生成された文章であり、正確性は保証しません。

Question 20: 文脈として与えられた最新論文の内容を、背景、新規性、方法などに分けて、詳しく説明してください。

背景:
医療知識の複雑性が増す中で、臨床現場において効率的かつ信頼性の高い情報アクセスシステムが必要とされています。品質管理のために、多くの病院では情報管理と地域治療標準の実施に標準作業手順(SOP)を使用しています。しかし、臨床の日常では、この情報が常に容易にアクセスできるわけではありません。カスタマイズされた大規模言語モデル(LLM)は、テーラーメイドの解決策を提供する可能性がありますが、臨床実装前に徹底的な評価が必要です。

新規性:
本研究の目的は、病院固有のSOPから情報を取得するためにLLMをカスタマイズし、臨床使用におけるその精度を評価し、異なるプロンプト戦略と大規模言語モデルを比較することです。これにより、臨床情報の取得を強化し、この技術の安全な適用を保証するために専門家の監督が不可欠であることを示しています。

方法:
GPT-4を予め定義されたシステムプロンプトと、ドレスデン大学病院の4つの部門からの10のSOPでカスタマイズしました。モデルの性能は、異なる詳細度を持つ30の定義済み臨床質問を通じて評価され、これらは5人の異なる医療専門知識レベルを持つオブザーバーによって単純およびインタラクティブな質問応答(Q&A)を通じて評価されました。答えの完全性、正確性、臨床使用のための十分性を評価し、プロンプト設計がモデル性能に与える影響を評価しました。最後に、GPT-4とClaude-3-opusの性能を比較しました。

結果:
インタラクティブなQ&Aは、完全性(80%)、正確性(83%)、十分性(60%)の最高の割合を達成しました。LLMの回答の受け入れは、キャリア初期の医療スタッフの間で高かったです。質問プロンプトの詳細度が回答の正確性に影響を与え、中間の詳細プロンプトが最高の十分性率を達成しました。LLMを比較すると、Claude-3-opusは十分な回答を提供する能力(70.0%対36.7%)でGPT-4を上回り、満足のいく回答を得るために必要な反復回数が少なかったです。どちらのモデルも、ブラウザアプリケーションよりも自己コーディングされたパイプラインでシステムプロンプトにより効果的に従いました。すべてのオブザーバーは、SOP内の情報の表現に根差す回答の正確性と完全性の間に相違を示しました。

結論:
カスタマイズされたLLMへのインタラクティブな問い合わせは、臨床情報の取得を強化することができますが、この技術の安全な適用を保証するためには専門家の監視が不可欠です。広範な評価を経て、プロンプトエンジニアリングに関する基本的な知識があれば、カスタマイズされたLLMは効率的で臨床的に適用可能なツールになる可能性があります。

Customizing GPT-4 for clinical information retrieval from standard operating procedures
Muti, H. S., Loeffler, C. M. L., Lessmann, M. E., Stueker, E. H., Kirchberg, J., von Bonin, M., Kolditz, M., Ferber, D., Egger-Heidrich, K., Merboth, F., Stange, D., Distler, M., Kather, J. N. 2024-06-24 http://medrxiv.org/cgi/content/short/2024.06.24.24309221v1

下記の文章は論文アブストラクトをもとに Retrieval-Augmented Language Modeling (RALM) により生成された文章であり、正確性は保証しません。

Question 21: 文脈として与えられた最新論文の内容を、背景、新規性、方法などに分けて、詳しく説明してください。

背景:
医療分野における健康イベントの予測は、電子健康記録(EHR)の急速な普及と広範な応用によって強化されています。特に集中治療室(ICU)においては、健康関連イベントを事前に正確に予測することが、患者のアウトカム向上のための治療や介入を提供する上で不可欠です。EHRは臨床テキスト、時系列データ、構造化データなど、複数のモダリティを含むマルチモーダルデータです。多くの健康イベント予測の研究は一つのモダリティ、例えばテキストや表形式のEHRに焦点を当てていますが、マルチモーダルEHRから効果的に学習する方法は依然として課題です。

新規性:
本論文では、大規模言語モデル(LLM)のテキスト処理における強力な能力に触発されて、LLMからの知識を蒸留し、マルチモーダルEHRから学習することで健康イベント予測を行うCKLEフレームワークを提案します。LLMを健康イベント予測に応用する際の2つの課題、すなわちLLMがテキストデータ以外のモダリティを扱えないこと、および健康アプリケーションのプライバシー問題がLLMのローカルデプロイを必要とするが計算リソースによって制限される可能性があることに取り組みます。

方法:
CKLEは、LLMからヘルスイベント予測モデルへのクロスモダリティ知識の蒸留によって、LLMのスケーラビリティとポータビリティの課題を解決します。LLMの強力な能力を完全に活用するために、原始的な臨床テキストをプロンプト学習で洗練させ、拡張します。臨床テキストの埋め込みはLLMによって生成されます。予測モデルにLLMの知識を効果的に蒸留するために、クロスモダリティ知識蒸留(KD)手法を設計しました。KDプロセスには、複数のモダリティと患者の類似性を考慮した特別に設計されたトレーニング目標が使用されます。KD損失関数は二つの部分から構成されます。一つは同一患者から異なるモダリティの相関をモデル化するクロスモダリティ対照的損失関数、もう一つは類似患者間の相関をモデル化する患者類似性学習損失関数です。クロスモダリティ知識蒸留は、臨床テキストの豊富な情報とLLMの知識を構造化されたEHRデータの予測モデルに蒸留することができます。

効果の検証:
CKLEの有効性を検証するために、心不全予測と高血圧予測の2つの健康イベント予測タスクで評価を行いました。MIMIC-IIIデータセットから7125人の患者を選び、トレーニング/検証/テストセットに分けました。CKLEは、健康イベント予測のために設計された最先端の予測モデルと比較して、最大4.48%の精度向上を達成することができました。この結果は、CKLEが通常および限定ラベル設定の両方でベースライン予測モデルを大幅に上回ることを示しています。また、心不全と高血圧予測の心臓病分析に関するケーススタディを実施しました。特徴の重要性計算を通じて、医療ドメインの知識に対応する心臓病に関連する顕著な特徴を分析しました。CKLEの優れたパフォーマンスと解釈可能性は、実際の臨床設定での健康イベント予測におけるLLMの力と知識を活用するための有望な道を開くものです。

Distilling the Knowledge from Large-language Model for Health Event Prediction
Ding, S., Ye, J., Hu, X., Zou, N. 2024-06-24 http://medrxiv.org/cgi/content/short/2024.06.23.24309365v1

下記の文章は論文アブストラクトをもとに Retrieval-Augmented Language Modeling (RALM) により生成された文章であり、正確性は保証しません。

Question 22: 文脈として与えられた最新論文の内容を、背景、新規性、方法などに分けて、詳しく説明してください。

背景:
心疾患は世界中で死因のトップであり、心機能を示す射出率(Ejection Fraction, EF)は患者の予後を決定する重要な指標です。EFの正確な測定は物理療法評価(PT evaluation)において重要ですが、エコーカルディオグラム(心臓エコー)を用いたEFの測定は読影者の主観によるバラツキ(intra-observer variance)や読影者間のバラツキ(inter-observer variance)が問題となっています。

新規性:
ディープラーニング(DL)技術の発展により、医療分野における進歩が見られます。本研究では、ViViEchoformerという新しいDLアプローチを導入しました。これはビデオビジョントランスフォーマーを使用して、エコーカルディオグラムの動画から直接左室機能(Left Ventricular Ejection Fraction, LVEF)を回帰分析する手法です。これにより、人間の評価と分析を補助し、精度の高い自動EF予測を可能にします。

方法:
本研究では、スタンフォード大学病院の患者から得られた10,030個の頂点4室ビューのエコーカルディオグラム動画データセットを使用しました。ViViEchoformerは、動画入力から時空間トークンを抽出することで空間情報を正確に捉え、フレーム間の関係を維持し、正確で完全自動のEF予測を行います。

結果:
ViViEchoformerによる射出率の予測は、平均絶対誤差が6.14%、平均二乗誤差が8.4%、平均二乗対数誤差が0.04、およびR2が0.55となりました。さらに、ViViEchoformerは射出率が50%未満の標準閾値を使用して、低射出率型心不全(Heart failure with reduced ejection fraction, HFrEF)をエリアアンダーカーブ0.83、分類精度87%で予測しました。

結論:
このビデオベースの方法は正確な左室機能の定量化を提供し、人間の評価に対する信頼性の高い代替手段を提供し、エコーカルディオグラム解釈の基礎を確立します。

ViViEchoformer: Deep Video Regressor Predicting Ejection Fraction
Akan, T., Alp, S., Bhuiyan, M. S., Helmy, T., Orr, A. W., Bhuiyan, M. M., Conrad, S., Vanchiere, J., Kevil, C. G., Bhuiyan, M. A. N. 2024-06-22 http://medrxiv.org/cgi/content/short/2024.06.21.24309327v1

下記の文章は論文アブストラクトをもとに Retrieval-Augmented Language Modeling (RALM) により生成された文章であり、正確性は保証しません。

Question 23: 文脈として与えられた最新論文の内容を、背景、新規性、方法などに分けて、詳しく説明してください。

背景:
医薬品の臨床試験において、薬物誘発性毒性は新薬が失敗する主要な理由の一つです。分子構造から薬物毒性を予測する機械学習モデルは、研究者がより少ない毒性の薬候補を優先するのに役立つ可能性があります。しかし、現在の毒性データセットは通常小さく、単一の臓器系(例えば、心臓、腎臓、肝臓など)に限られています。これらのデータセットを作成するには、専門家が100ページを超える可能性のある薬剤ラベル文書を精査するなど、時間を要する作業が必要でした。

新規性:
本研究で紹介されている「UniTox1」という統合データセットは、FDAが承認した2,418種類の薬物に関する薬物誘発性毒性の要約と評価を含んでおり、これはGPT-4oを用いてFDAの薬剤ラベルを処理することで作成されました。UniToxは、心毒性、肝毒性、腎毒性、肺毒性、血液毒性、皮膚毒性、耳毒性、不妊という8種類の毒性をカバーしています。これは、薬物と毒性の数において、これまでで最大の体系的なヒトin vivoデータベースであり、これらの毒性のほとんど全てについて承認されたFDAの薬剤をカバーする最初のものです。

方法:
UniToxの毒性評価は、ランダムに選んだサンプルについて臨床医が検証し、UniToxの毒性評価は臨床医のラベル付けと87-96%の時間で一致しています。最終的に、UniToxでトレーニングされたグラフニューラルネットワークのベンチマークを行い、このデータセットが分子毒性予測モデルの構築における有用性を示しています。

以上の内容から、UniTox1は、薬物誘発性毒性の予測と評価に関する大規模かつ包括的なデータセットであり、機械学習モデルを用いた新薬候補の選定における毒性リスクの低減に寄与する可能性があると言えます。また、臨床医による検証を経てその信頼性が確認されており、毒性予測の精度を高めるための重要な基盤となることが期待されます。

UniTox: Leveraging LLMs to Curate a Unified Dataset of Drug-Induced Toxicity from FDA Labels
Silberg, J., Swanson, K., Simon, E., Zhang, A., Ghazizadeh, Z., Ogden, S., Hamadeh, H., Zou, J. 2024-06-22 http://medrxiv.org/cgi/content/short/2024.06.21.24309315v1

下記の文章は論文アブストラクトをもとに Retrieval-Augmented Language Modeling (RALM) により生成された文章であり、正確性は保証しません。

Question 24: 文脈として与えられた最新論文の内容を、背景、新規性、方法などに分けて、詳しく説明してください。

背景:
現在、西洋諸国の多くの公立病院では、かなりの期間満床状態が続いています。このような状況では、緊急入院の遅延が一般的であり、患者の不快感を引き起こし、ケアの質に悪影響を及ぼすことがあります。病院の退院数を日々予測することは、病院の過密を防ぐための措置を病院管理者が実施することを可能にします。

新規性:
この研究では、人工知能の手法を用いて、7日前からの病院の日々の退院数を予測し、分析された日の80%以上で成功した予測を得ることができました。これにより、利用可能な機械学習手法が、高い効率と信頼性で7日前までの病院退院を予測するための新しく貴重な選択肢を提供することを示しました。

方法:
本研究では、2018年1月から2023年8月までの大学病院の救急部門からの病院入院全件(n=67308)を分析しました。新しい入院に関するデータを週ごとに取得するという、見込みのトレインテスト分割を定義しました。まず、各入院に対する滞在期間(LOS)の予測を生成するために、Light Gradient Boosting Machines(LGBM)とMultilayer Perceptron(MLP)モデルをトレーニングしました。予測されたLOSに基づいて、時系列が構築され、7日後の病棟別の日々の病院退院に関する予測が、さまざまな予測技術を用いて作成されました。予測と観測された退院の間の平均絶対誤差(MAE)を使用して、予測の精度を測定しました。また、退院予測は、病院の日々の退院数の平均を10%超えない場合に成功したと分類されました。

結果として、LGBMはMLPをわずかに上回り、25週間のLOS予測で(MAE 4.7{+/-}0.7日対4.9{+/-}0.7日、p<0.001)でした。7日前の病院の日々の退院数を予測するための最良の技術は、Prophet(MAE 5.0、R2=0.85)、LGBM(MAE 5.2、R2=0.85)、季節性ARIMA(MAE 5.5、R2=0.81)、Temporal Fusion Transformer(TFT)(MAE 5.7、R2=0.83)を使用して得られました。予測を分類した後、LGBM、Prophet、季節性ARIMA、TFTはそれぞれ82.3%、81.1%、77.7%、77.1%の日で成功した予測に達しました。

結論:
LGBMを使用したLOSの予測と時系列予測技術を組み合わせることで、7日前までの日々の病院退院の成功した予測が得られました。

Hospital Discharge Prediction Using Machine Learning
Oristrell, J., Pascual, A., Millet, P., Lazaro, G. R., Benavent, A. 2024-06-21 http://medrxiv.org/cgi/content/short/2024.06.20.24309256v1

下記の文章は論文アブストラクトをもとに Retrieval-Augmented Language Modeling (RALM) により生成された文章であり、正確性は保証しません。

Question 25: 文脈として与えられた最新論文の内容を、背景、新規性、方法などに分けて、詳しく説明してください。

背景:
本研究では、入院時に収集される患者の情報を活用して、1年間の入院死亡リスクを予測するアンサンブル長短期記憶ニューラルネットワーク(ELSTM)を開発し、検証することを目的としています。終末期にある患者を特定し、ケアの目標(GOC)に関する議論のために役立てることが狙いです。

新規性:
ELSTMは、患者の縦断的データを統合することで、入院中に限られた情報しか利用できない場合でも、病気の重症度や患者の全体的な状態についてのより良い洞察を提供することができます。これは、患者の長期的な健康予測に対して、従来の意思決定プロセスよりも精度を高める可能性があるという点で新規性があります。

方法:
研究では、入院時のみに報告可能な予測因子(Ad-mDemo)を含むELSTMと、患者の滞在中に後で利用可能になる診断(AdmDemoDx)を追加したELSTMの2つの戦略を評価しました。2011年から2017年の間に入院した82,104人の患者の記録を使用して、時間的および非時間的戦略を比較しました。また、2017年から2021年にかけてGOC議論の対象となる33,898人の患者に対する最良の戦略の臨床的有用性を定量化しました。

結果:
AdmDemoおよびAdmDemoDx予測因子を使用したELSTMは、それぞれAUROCが0.73-0.90および0.79-0.93という高い性能を示しました。ELSTMに基づく意思決定は、従来の意思決定プロセスと比較して予測精度を最大12.1%向上させましたが、感度は最大3.8%低下しました。

結論:
提案されたELSTMは、自動化された正確なモデルであり、1年間の高死亡リスク患者を特定することができます。これは、終末期ケアの改善に向けた臨床意思決定支援システムでの使用が潜在的に可能です。

Leveraging patients' longitudinal data to improve the Hospital One-year Mortality Risk
Laribi, H., Raymond, N., Taseen, R., Poenaru, D., Vallieres, M. 2024-06-21 http://medrxiv.org/cgi/content/short/2024.06.21.24309191v1

下記の文章は論文アブストラクトをもとに Retrieval-Augmented Language Modeling (RALM) により生成された文章であり、正確性は保証しません。

Question 26: 文脈として与えられた最新論文の内容を、背景、新規性、方法などに分けて、詳しく説明してください。

背景:
免疫チェックポイント阻害剤(ICIs)は、抑制的な経路をブロックすることで、免疫システムががん細胞を標的にして破壊する能力を高める治療法です。これらの治療は効果的ですが、急性腎障害(ICI-AKI)などの免疫関連有害事象(irAEs)を引き起こす可能性があり、患者の管理を複雑にします。ICI-AKIに対する遺伝的な傾向は十分に理解されておらず、リスク要因を特定し治療戦略を改善するためには、包括的なゲノム研究が必要です。

新規性:
本研究は、大規模現実世界データを使用してICI-AKIの遺伝的傾向を同定することを目的としています。これまでの研究では、ICI-AKIに対する遺伝的な傾向はあまり明らかにされていませんでしたが、本研究では、All of Usコホートを用いた新たな遺伝子変異のリスクが示されています。

方法:
システマティックな文献検索により、irAEsに関連する14の候補変異が特定されました。All of Usコホート(AoU、v7、カットオフ日:2022年7月1日)を用いて、これら14の変異に関する候補変異関連研究を実施しました。ICIを受けているがん患者のコホートと一般コホートを設定し、ICI-AKIリスクを評価しました。各候補遺伝子型の影響を性別で調整したロジスティック回帰を用いて評価しました。自己申告された人種と祖先推定人種ごとに別々に行いました。Kaplan-Meier生存分析を使用して、AKIフリー生存に対する遺伝的影響を評価しました。

結果:
ICIコホート(n=414)では、1年間のAKI発生率が23.2%で、これは一般コホート(6.5%、n=213,282)よりも有意に高かった。PCCA遺伝子のrs16957301変異(chr13:100324308、T>C)は、自己申告した白人(ベータ=0.93、ボンフェローニ補正P値=0.047)および祖先推定白人(ベータ=0.94、ボンフェローニ補正P値=0.044)において、ICI-AKIの有意なリスク遺伝子型でした。自己申告した白人でrs16957301リスク遺伝子型(TC/CC)を持つ患者は、参照遺伝子型(TT)と比較して有意に早く(3.6ヶ月対7.0ヶ月、log-rank P=0.04)AKIを発症しました。祖先推定白人でも同様の結果が見られました。この変異は一般コホートにおいて有意なAKIリスクを示さなかった(ベータ: -0.008-0.035、FDR: 0.75-0.99)。

結論:
All of Usコホートからの実世界の証拠によると、白人においてPCCA変異rs16957301はICI治療に特有の新たなAKIリスク遺伝子型であることが示唆されます。ICIで治療される白人患者におけるAKIのリスクマーカーとしてrs16957301を検証するための追加研究が必要であり、他の祖先集団でのリスクも評価する必要があります。

PCCA variant rs16957301 is a novel AKI risk genotype-specific for patients who receive ICI treatment: Real-world evidence from All of Us cohort
Wang, Y., Xiong, C., Yu, W., Zhou, M., Shugg, T. A., Hsu, F.-C., Eadon, M. T., Su, J., Song, Q. 2024-06-20 http://medrxiv.org/cgi/content/short/2024.06.20.24309197v1

下記の文章は論文アブストラクトをもとに Retrieval-Augmented Language Modeling (RALM) により生成された文章であり、正確性は保証しません。

Question 27: 文脈として与えられた最新論文の内容を、背景、新規性、方法などに分けて、詳しく説明してください。

背景:
電子健康記録(EHR)には、疾患の進行度や治療への反応性など、他では得られない情報が含まれていることが多いです。これらの情報は臨床分析にとって非常に価値があります。しかし、アメリカ合衆国では、研究目的でこれらのデータを広く利用するために、個人を特定できる情報(PII)をHIPAAのプライバシールールに従ってEHRから削除する必要があります。人間の精度を模倣する自動ディー識別システムを用いることで、多様な非識別データセットへのアクセスをスケールで可能にし、医療研究における堅牢な発見を促進し、患者ケアを進歩させることができます。

新規性:
本論文では、ある健康機関で訓練されたPII検出アンサンブルメソッドを、機関固有の辞書を使用して位置情報に特有なPIIを捉え、以前にPIIと誤分類されていた医療関連情報を回復することで、他の健康機関に適応させる「ローカルに拡張されたアンサンブル」を紹介しています。このアンサンブルモデルはメイヨークリニックで作成され、デューク大学健康システムの15,716件の臨床ノートのデータセットでテストされました。さらに、2014年のi2b2と2003年のCoNLL NERデータセットにおいて、タスク固有の微調整されたアンサンブルと、LLMベースのプロンプトエンジニアリングソリューションを予測精度、速度、コストで比較しています。

方法:
論文では、既存のPII検出アンサンブルメソッドを、機関固有の辞書を用いて拡張し、さまざまな健康機関のデータセットに適応させる手法を導入しています。具体的には、メイヨークリニックで作成されたアンサンブルモデルを拡張し、デューク大学健康システムの臨床ノートデータセットでテストし、その結果をLLMに基づくプロンプトエンジニアリングソリューションと比較しています。評価は、リコールとプレシジョンの増加、予測精度、速度、コストを基準に行われました。

デューク大学のノートにおけるアプローチの成果は、拡張なしでの0.989と0.979に対して、リコールとプレシジョンがそれぞれ0.996と0.982に増加しました。これは、LLMがアンサンブルアプローチに達するためにはかなりのプロンプトエンジニアリングの労力が必要であることを示しています。さらに、現在の技術状況では、LLMはアンサンブルアプローチに比べて少なくとも3倍遅く、5倍高価であることがわかります。

Scaling text de-identification using locally augmented ensembles
Murugadoss, K., Kilamsetty, S., Doddahonnaiah, D., Iyer, N., Pencina, M., Ferranti, J., Halamka, J., Malin, B. A., Ardhanari, S. 2024-06-20 http://medrxiv.org/cgi/content/short/2024.06.20.24308896v1

下記の文章は論文アブストラクトをもとに Retrieval-Augmented Language Modeling (RALM) により生成された文章であり、正確性は保証しません。

Question 28: 文脈として与えられた最新論文の内容を、背景、新規性、方法などに分けて、詳しく説明してください。

背景:
本研究は、高齢者の健康保険の選択に関わる社会経済的および人口統計学的決定因子に焦点を当てています。インドでは現在、急性の病気の増加により集中治療が必要とされ、治療費の上昇と医療施設の利用頻度の増加が問題になっています。また、インドは高齢化が進んでおり、将来的にも高齢者人口が増加することが予測されているため、健康保険のアクセス性に関する議論が活発になっています。

新規性:
この論文は、長寿化社会を迎えつつあるインドにおける健康保険スキームの選択に影響を与える要因を明らかにしようとするものです。特に、高齢者を対象にした健康保険の選択に関する社会経済的および人口統計学的な決定因子を分析し、インドの健康保険市場の実際の遅れを追跡し、政策立案者が健康保険政策を策定するのに役立てることを目的としています。

方法:
研究では、インドの高齢化調査(Longitudinal Survey of Aging in India, LASI)Wave-1 2020のデータを使用し、45歳以上の66,658人の高齢者を対象に分析を行いました。データ分析には、二項関連と多項ロジスティック回帰分析が用いられ、さまざまな健康保険にアクセスしているか否かについて、社会経済的および人口統計学的決定因子の関連を検討しました。

結果:
研究の結果、政府の健康保険の利用が、コミュニティ、雇用主、または私的な健康保険よりも高いことが示されました。これは、人口統計学的、地理的、経済的分布および健康状態のすべてのカテゴリーにおいて観察され、慢性病が保険選択に影響を与える一因となっていることがわかりました。

提案:
研究は、健康保険市場を透明化し、健康保険スキームの失敗の可能性を減らすための政策行動を取ることを推奨しています。これにより、アクセス可能な医療サービスの提供に向けた重要なステップとなるでしょう。

Health Security Across the Spectrum: Exploring the Impact of Socio-Economic Factors on Health Insurance Uptake in India
Chatterjee, M., Aditya, A., Choudhary, P. K. 2024-06-20 http://medrxiv.org/cgi/content/short/2024.06.19.24309161v1

下記の文章は論文アブストラクトをもとに Retrieval-Augmented Language Modeling (RALM) により生成された文章であり、正確性は保証しません。

Question 29: 文脈として与えられた最新論文の内容を、背景、新規性、方法などに分けて、詳しく説明してください。

背景:
現在、大腸癌は発生頻度が第三位のがんであり、早期発見と効果的な治療を確立するためには、ポリープの悪性度を検出する段階での大腸内視鏡検査が重要です。大腸ポリープの二値分類と前がん性リスクの評価に特化した深層学習アーキテクチャを探求することが、この論文の主な目的です。

新規性:
この論文では、大腸内視鏡データセットからの画像に基づいて、腺腫性、過形成性、および鋸歯状ポリープのサンプルを良性と前がん性に分類するカスタムベースの深層学習アーキテクチャ「Bionnica」を作成しています。このモデルは、マスクされたオートエンコーダーを通じて画像の出力を変更し、分類性能を向上させます。これにより、従来のモデルよりも優れた性能を発揮します。

方法:
論文では、4つの最先端の深層学習モデル(ZF NET、VGG-16、AlexNet、およびResNet-50)を評価しています。実験により、ResNet-50とZF NETが最も精度が高い(84%以上)ことが示され、特にResNet-50は前がん性大腸ポリープの患者を示すのに優れている(92%以上)ことが分かりました。また、ZF NETは700枚の画像を処理する速度が最も速いです。提案された深層学習モデルであるBionnicaは、ZF NETよりも性能が高く、シンプルな構造を持っているため、大腸ポリープの効率的な分類を提供します。このモデルの利点は、学習プロセスをガイドし、医療従事者の意思決定をサポートするルールベースの層によるカスタムエンハンスメントの解釈可能性にあります。

Bionnica: A Deep Neural Network Architecture for Colorectal Polyps' Premalignancy Risk Evaluation
Babuc, D., Ivascu, T., Ardelean, M., Onchis, D. 2024-06-20 http://medrxiv.org/cgi/content/short/2024.06.19.24309153v1

下記の文章は論文アブストラクトをもとに Retrieval-Augmented Language Modeling (RALM) により生成された文章であり、正確性は保証しません。

Question 30: 文脈として与えられた最新論文の内容を、背景、新規性、方法などに分けて、詳しく説明してください。

背景:
最新の論文では、大規模言語モデル(LLMs)が医療分野での臨床的意思決定、行政的効率性、患者の成果向上において大きな可能性を示していることが指摘されています。しかし、これらのモデルの開発と適用における多様なグループの代表性の不足は、バイアスを永続させ、公平でない医療提供につながるリスクがあるとされています。

新規性:
この論文は、2021年1月1日から2024年6月16日までのLLM研究に関する包括的な科学計量学的分析を提示しており、PubMedとDimensionsからのメタデータを分析しています。この分析には、著者の所属、国、資金源などが含まれています。特に新しい点は、科学出版物の包括性を測定するためにジニ不純度に基づく新規なジャーナル多様性指数を導入していることです。

方法:
論文では、LLM研究に対する貢献者の多様性を評価するために、PubMedとDimensionsのメタデータを分析しています。著者の所属、国、資金源などの情報を用いて、性別や地理的な偏りを明らかにしています。また、科学出版物の多様性を評価するために、ジニ不純度に基づくジャーナル多様性指数を用いています。

結果として、性別と地理的な不均衡が顕著であり、特に男性著者が優勢であり、高所得国(HICs)からの貢献が主であることが強調されています。これらの結果は、医療におけるLLMsの公平な適用を確保するために、より大きな代表性が必要であることを示唆しています。

提案:
論文では、人工知能研究における多様性と包括性を強化するための実行可能な戦略を提案しています。これには、研究者の多様化、資金提供の公平性の向上、多様なグループへのアウトリーチの促進などが含まれている可能性があります。最終的な目標は、医療イノベーションにおけるより包括的で公平な未来を育成することです。

Analyzing Diversity in Healthcare LLM Research: A Scientometric Perspective
Restrepo, D., Wu, C., Vasquez-Venegas, C., Matos, J., Gallifant, J., Nakayama, L. F. 2024-06-19 http://medrxiv.org/cgi/content/short/2024.06.18.24309113v1

この記事が気に入ったらサポートをしてみませんか?