見出し画像

Recent medRxiv on Health Informatics: July 13, 2024

下記の文章は論文アブストラクトをもとに Retrieval-Augmented Language Modeling (RALM) により生成された文章であり、正確性は保証しません。

Question 1: 文脈として与えられた最新論文の内容を、背景、新規性、方法などに分けて、詳しく説明してください。

この研究は、集中治療室(ICU)で機械換気(MV)を受けている患者の病院死亡率を予測するモデルを開発することを目的としています。MVは重症患者にとって不可欠ですが、高い死亡リスクも伴います。このモデルは、ICUの医師が早期に警告を受けるための支援となることを意図しています。

【背景】
機械換気は重症患者にとって重要ですが、それに伴う死亡リスクも高いため、病院死亡率を予測することが重要です。この研究では、ICUでMVを受ける患者の死亡率を予測するための機械学習モデルを開発することを目指しています。

【新規性】
この研究は、MIMIC-IIIデータベースを使用して、機械学習フレームワークを用いてICUのMV患者の病院死亡率を予測する新しい試みです。特に、CatBoostモデルが使用され、その性能は他のモデルと比較して優れていることが示されました。

【方法】
患者はICD-9コードを使用して特定され、25,202人の患者が選ばれました。バックワードエリミネーションとLassoメソッドを用いて、32の特徴が選ばれました。データの前処理には、90%以上の欠損データを持つ列の削除と、残りの欠損値に対する平均値代入が含まれます。クラスの不均衡に対処するために、合成少数派オーバーサンプリング技術(SMOTE)が使用されました。いくつかの機械学習モデルが評価され、70/30の訓練テスト分割を使用しました。CatBoostモデルが選ばれ、その性能は精度、適合率、再現率、F1スコア、AUROCメトリック、および校正プロットの面で優れていました。

【結果】
CatBoostモデルはAUROCが0.862に達し、初期のAUROC 0.821からの増加を示しました。これは文献で報告された最高の結果を上回っています。また、精度は0.789、F1スコアは0.747で、他のモデルよりも優れた校正を示しました。

【結論】
前処理方法論は、計算プロセスを簡素化し、以前は見過ごされがちだった重要な特徴を特定するのに役立ちました。これらの特徴を統合し、パラメータを調整することで、モデルは未知のデータに対して強い一般化能力を示しました。これは、ICUでの資源配分を強化し、MV患者に対するより個別化された介入を提供するための機械学習の潜在能力を強調しています。

A Machine Learning-Based Prediction of Hospital Mortality in Mechanically Ventilated ICU Patients
Li, H., Ashrafi, N., Kang, C., Zhao, G., Chen, Y., Pishgar, M. 2024-07-12 http://medrxiv.org/cgi/content/short/2024.07.12.24310325v1

下記の文章は論文アブストラクトをもとに Retrieval-Augmented Language Modeling (RALM) により生成された文章であり、正確性は保証しません。

Question 2: 文脈として与えられた最新論文の内容を、背景、新規性、方法などに分けて、詳しく説明してください。

この研究の背景では、臨床研究において、人口コホート研究や電子健康記録からのビッグデータを活用して新たな介入を設計し、健康成果を改善し、医療提供の効率を高める強い動きがあります。しかし、これらの潜在的な要求を実現するためには、ソースデータセットの調和と研究データのキュレーションに多大な努力が必要であり、現在はコストがかかり時間を要する手動および労働集約的な方法に依存しています。

新規性としては、この研究は自然言語処理(NLP)と教師なし機械学習(ML)の人工知能(AI)手法の適用性を評価し、ビッグデータのセマンティック調和とキュレーションの課題に対処します。自動化されたツールの開発に向けて、効率的で堅牢な技術基盤を確立することを目指しています。

方法としては、NLPと教師なしMLアルゴリズムを評価し、自動セマンティック調和のための2つのパイプラインを提案します。一つはドメイン関連変数のセマンティックス対応検索のためのパイプライン、もう一つはセマンティックに類似した変数のクラスタリングのためのパイプラインです。英国の長期研究(ELSA)データベースからの94,037のテキスト変数記述を使用してパイプラインのパフォーマンスを評価しました。セマンティック検索パイプラインはAUCが0.899(SD=0.056)で高い精度を示し、セマンティッククラスタリングパイプラインはV-メジャーが0.237(SD=0.157)で、他の関連ドメインの先進的な実装と同等です。

この研究は、NLPと教師なしMLなどのAI技術が、臨床研究のためのビッグデータの調和とキュレーションを自動化する潜在力を強調しています。堅牢な技術基盤を確立することで、データ処理を効率化し、健康データ科学者が彼らの研究でビッグデータをより効率的かつ効果的に活用できるようにし、臨床利益のためのデータからの洞察を加速します。

Pretrained Language Models for Semantics-Aware Data Harmonisation of Observational Clinical Studies in the Era of Big Data
Dylag, J. J., Zlatev, Z., Boniface, M. 2024-07-12 http://medrxiv.org/cgi/content/short/2024.07.12.24310136v1

下記の文章は論文アブストラクトをもとに Retrieval-Augmented Language Modeling (RALM) により生成された文章であり、正確性は保証しません。

Question 3: 文脈として与えられた最新論文の内容を、背景、新規性、方法などに分けて、詳しく説明してください。

この論文では、医療ポッドキャストの広がりを背景に、公開されている医療ポッドキャストデータの情報内容を活用して大規模言語モデル(LLMs)を強化する計算フレームワークが提案されています。この研究の背景には、専門用語、多様な医療トピック、専門家の対話が豊富に含まれる4,300時間以上のオーディオコンテンツがあり、これが39百万以上のテキストトークンに転写されました。

新規性としては、この研究が医療ポッドキャストのダイアログの多様性を統合することにより、自然言語のニュアンス、文化的文脈、医療知識の理解を向上させることを目指している点が挙げられます。具体的には、MedPodGPTと名付けられたモデルが開発され、これにより自然言語処理が進化し、医療研究や教育における様々なアプリケーションでの機能が強化されます。

方法としては、まず医療ポッドキャストのオーディオコンテンツをテキストに転写し、その後、そのテキストデータを用いて言語モデルを訓練しています。MedPodGPTは複数のベンチマークで評価され、標準のオープンソースベンチマークと比較して平均2.31%の改善が見られました。さらに、ゼロショット多言語転送能力において2.58%の改善が示され、異なる言語文脈への一般化が効果的に行われています。

このように、この研究は医療ポッドキャストの未利用の可能性を活用し、自然言語処理を進化させることで、医療分野におけるさまざまな応用に対して強化された能力を提供しています。

MedPodGPT: A multilingual audio-augmented large language model for medical research and education
Jia, S., Bit, S., Searls, E., Claus, L., Fan, P., Jasodanand, V. H., Lauber, M. V., Veerapaneni, D., Wang, W. M., Au, R., Kolachalama, V. B. 2024-07-12 http://medrxiv.org/cgi/content/short/2024.07.11.24310304v1

下記の文章は論文アブストラクトをもとに Retrieval-Augmented Language Modeling (RALM) により生成された文章であり、正確性は保証しません。

Question 4: 文脈として与えられた最新論文の内容を、背景、新規性、方法などに分けて、詳しく説明してください。

背景:
病理画像の解析は臨床診断において重要な役割を果たしています。従来の病理画像解析では、特定のソースとターゲットのドメインペアに特化した画像変換モデルが使用されていました。これらのモデルは、色の正規化や仮想染色などのタスクを支援するために、既存の病理画像から新たな画像を合成します。しかし、これらのモデルはスケーラビリティに欠け、複数のドメイン間での変換には適していませんでした。

新規性:
本研究では、His-MMDM(Histopathological Multi-Domain Multi-Omics Diffusion Model)という新しいフレームワークを導入しています。このモデルは、拡散モデルに基づいており、無制限の数のカテゴリドメイン間での病理画像の変換を可能にします。これにより、異なる腫瘍タイプ間での腫瘍画像の変換など、新しいアプリケーションが可能になります。また、His-MMDMは、凍結切片からホルマリン固定パラフィン包埋(FFPE)画像への変換など、既存のタスクにおいても専用モデルと同等の性能を発揮します。

方法:
His-MMDMは、複数のオミックス情報(ゲノミクスやトランスクリプトミクス)をガイドとして使用し、病理画像の編集を行うことができます。これにより、ドライバー変異やオンコジェン経路の変化が組織の病理学に与える影響を示すことができます。この多用途性により、His-MMDMは将来の病理学者のためのGenAIツールキットにおいて重要なツールとなり得ます。

このように、His-MMDMは従来のモデルの限界を克服し、病理画像の解析と編集の新たな可能性を開拓するものです。

His-MMDM: Multi-domain and Multi-omics Translation of Histopathology Images with Diffusion Models
Li, Z., Su, T., Zhang, B., Han, W., Zhang, S., Sun, G., Cong, Y., Chen, X., Qi, J., Wang, Y., Zhao, S., Meng, H., Liang, P., Gao, X. 2024-07-12 http://medrxiv.org/cgi/content/short/2024.07.11.24310294v1

下記の文章は論文アブストラクトをもとに Retrieval-Augmented Language Modeling (RALM) により生成された文章であり、正確性は保証しません。

Question 5: 文脈として与えられた最新論文の内容を、背景、新規性、方法などに分けて、詳しく説明してください。

この研究の背景は、医療決定の文書化における潜在的な不平等を検出することが、より公平な医療実践を実現し、医療政策の策定に寄与し、計算モデルがそのような偏見を学習して繰り返すことを防ぐために重要であるという点にあります。目的は、患者の人種、性別、言語能力に関連する医療決定の文書化における格差を特定することです。

新規性としては、この研究はMIMIC-IIIデータセットを使用しており、このデータセットにはベス・イスラエル・ディーコネス医療センターの集中治療室に入院した患者の匿名化された健康データが含まれています。これにより、実際の臨床環境で収集された大規模なデータを利用して、文書化された医療決定における言語能力に基づく格差を分析することが可能となりました。

方法としては、この横断研究は、MIMIC-IIIから取得した451件の退院サマリーを含み、10の医療決定カテゴリに基づいて領域の専門家によって注釈が付けられています。注釈付けされた退院サマリーは、人種、性別、言語能力、診断コード、ICUのタイプ、患者ステータスコード、患者の共存症(Elixhauser Comorbidity Indexによって定量化)によって層別化され、潜在的な交絡因子を考慮しています。Welchのt検定とボンフェローニ補正を使用して、医療決定の頻度における有意な格差を特定しました。

結果として、56,759の医療決定テキストセグメントが451の退院サマリーで文書化されて分析されました。人口統計グループ間での分析により、英語堪能な患者は非英語堪能な患者に比べて、いくつかのカテゴリで文書化の頻度が高いことが示され、文書化またはケアにおける潜在的な格差が示唆されました。特に、英語堪能な患者は、循環器系および内分泌、栄養および代謝疾患に関連する状況で「問題の定義」などの重要な決定カテゴリで文書化された決定が一貫して多かったです。しかし、性別や人種に基づく医療決定の文書化における有意な格差は見つかりませんでした。

結論として、この研究は、英語堪能な患者が非英語堪能な患者に比べてより包括的な文書化を受けているという文書化の格差を示しています。一方で、性別や人種に関しては有意な格差は特定されませんでした。これらの発見は、すべての患者が同じレベルの詳細なケア文書化を受け、計算モデルがそのような偏見を学習して繰り返すことを防ぐために、医療文書化実践の公平性を向上させるための対象となる介入が必要である可能性を示唆しています。

Analysis of Race, Sex, and Language Proficiency Disparities in Documented Medical Decisions
Amiri, H., Vakil, N., Elgaar, M., Cheng, J., Mohtarami, M., Wong, A., Sadrolashrafi, M., Celi, L. A. G. 2024-07-12 http://medrxiv.org/cgi/content/short/2024.07.11.24310289v1

下記の文章は論文アブストラクトをもとに Retrieval-Augmented Language Modeling (RALM) により生成された文章であり、正確性は保証しません。

Question 6: 文脈として与えられた最新論文の内容を、背景、新規性、方法などに分けて、詳しく説明してください。

この研究は、心臓の不整脈を診断する際に、高度なディープニューラルネットワークが心臓病専門医を上回る性能を発揮する可能性があることを背景にしています。しかし、大規模なトレーニングデータの入手が現実的でない場合が多いため、この研究はトランスファーラーニングの使用を探求しています。

【背景】
従来の心臓病診断では、専門の医師が心電図(ECG)パターンを分析して不整脈を診断します。近年、ディープラーニング技術が医療分野でも応用され始めており、特に大規模なデータセットに基づくトレーニングを行うことで、これらのモデルは専門医の診断を上回る精度を達成することが示されています。

【新規性】
この研究の新規性は、2D画像分類タスクで得られた知識を1Dの時系列ECG信号分類の領域に適用するトランスファーラーニングの手法にあります。具体的には、ECG信号の連続ウェーブレット変換(2D表現)を用いて、これらの信号を分類するための深層学習モデルを活用しています。

【方法】
研究では、まず2D画像分類で訓練された深層学習モデルを用いて、ECG信号の2D表現を学習します。これには、ECG信号を連続ウェーブレット変換によって2D形式に変換し、それを入力として使用します。次に、これらのモデルを使って、3種類のECGパターンを識別・分類する能力を評価します。

【評価】
研究の最終段階では、これらのトランスファーラーニングを適用した深層学習モデルが、実際のECG時系列データの分類にどれだけ効果的であるかを評価します。この評価を通じて、モデルの診断精度や、専門医との比較、さらには実際の臨床現場での応用可能性について検討されます。

この研究は、限られたデータリソースを持つ環境でも高精度な不整脈診断が可能となる可能性を示唆しており、医療分野におけるディープラーニング技術の応用範囲を広げるものです。

2D Transfer Learning for ECG Classification using Continuous Wavelet Transform
Zhang, W. 2024-07-11 http://medrxiv.org/cgi/content/short/2024.07.11.24310258v1

下記の文章は論文アブストラクトをもとに Retrieval-Augmented Language Modeling (RALM) により生成された文章であり、正確性は保証しません。

Question 7: 文脈として与えられた最新論文の内容を、背景、新規性、方法などに分けて、詳しく説明してください。

この研究は、カナダとイギリスのアプリストアで利用可能な自殺防止モバイルアプリの特性、特徴、および内容を調査することを目的としています。

背景:
自殺防止は世界中で重要な公衆衛生の課題であり、モバイルアプリは自殺行動を抑制するための支援を提供するための新しい手段として注目されています。特に、カナダとイギリスでは、自殺防止アプリの需要が高まっており、これらのアプリがどのように設計されているか、どのような内容を提供しているかを理解することが重要です。

新規性:
本研究は、自殺防止アプリの包括的なレビューを行うことで、アプリの設計、セキュリティ機能、パーソナライゼーションのオプション、および提供されるコンテンツの種類を詳細に分析します。これにより、将来の自殺防止アプリの開発に役立つ洞察を提供することができます。

方法:
研究デザインは、2023年3月から4月にかけてAppleおよびAndroidのアプリストアから自殺防止アプリを特定し、事前に定義された選択基準に基づいてスクリーニングを行いました。重複するアプリは削除され、残ったアプリからは、ジャンル、アプリ開発者などの記述的特徴、パスワード保護などのセキュリティ機能、パーソナライゼーションオプションなどのデザイン機能に基づいてデータが抽出されました。アプリの内容は、Essential Features Frameworkを使用して評価され、抽出されたデータは内容分析アプローチを使用して分析されました。

結果:
レビューには52の自殺防止アプリが含まれており、ほとんどが一般人向けで、英語のみで提供されていました。アプリのアクセシビリティを高めるために手話を使用してコンテンツを提示するオプションを提供するアプリは1つだけでした。多くのアプリはテキストコンテンツの追加によるある程度のパーソナライゼーションを許可していましたが、写真やオーディオコンテンツのアップロードなどのさらなるカスタマイズを促進するものはほとんどありませんでした。すべての特定されたアプリは、Essential Features Frameworkの少なくとも1つのドメインのコンテンツを含んでいました。最も一般的に含まれていたドメインは、自殺防止の支援源と自殺に関する情報でした。最も頻繁に含まれていなかったドメインは、スクリーニングツールとウェルネスコンテンツでした。患者の医療記録にリンクする機能を持つアプリは見つかりませんでした。

Characteristics of Suicide Prevention Apps: A Content Analysis of Apps Available in Canada and the United Kingdom
Bennett-Poynter, L., Groves, S., Kemp, J., Shin, H. D., Sequeira, L., Lascelles, K., Strudwick, G. 2024-07-10 http://medrxiv.org/cgi/content/short/2024.07.10.24310091v1

下記の文章は論文アブストラクトをもとに Retrieval-Augmented Language Modeling (RALM) により生成された文章であり、正確性は保証しません。

Question 8: 文脈として与えられた最新論文の内容を、背景、新規性、方法などに分けて、詳しく説明してください。

背景:
この研究の目的は、電子健康記録(EHR)の臨床ノートから薬剤の有害事象(ADE)を検出するためのトランスフォーマーベースの自然言語処理(NLP)システムを開発することです。以前の研究では、ADEの検出において様々なアプローチが試みられましたが、トランスフォーマーモデルを用いた研究は限られており、特に長いテキストを扱う際の性能に課題がありました。

新規性:
この研究の新規性は、BERT Short-FormersとClinical-Longformerという二つのトランスフォーマーモデルを用いて、特に長い臨床ノートに対しても効果的なADE検出を目指した点にあります。また、データ処理方法として、ウィンドウベースとスプリットベースの二つのアプローチを比較検討し、最適な方法を探求しました。

方法:
具体的な方法として、2018年の国立NLP臨床チャレンジ(n2c2)の共有タスクトラック2の処理済みデータセットを用いて、BERT Short-FormersとClinical-Longformerをファインチューニングしました。データ処理には、15単語ウィンドウと10チャンクスプリットを用いたウィンドウベースアプローチとスプリットベースアプローチを採用し、どちらが最適かを検討しました。評価は、Vanderbilt University Medical Center(VUMC)のEHRから抽出したデータセットを用いて一般化能力を評価しました。

結果:
n2c2データセットでは、PubMedBERTを用いた15単語ウィンドウとClinical-Longformerを用いた10チャンクスプリットで、それぞれ平均マクロFスコアが0.832と0.868を達成しました。VUMCデータセットでは、PubMedBERTとClinical-Longformerを用いた4チャンクスプリットで、それぞれ平均マクロFスコアが0.720と0.786を達成しました。

議論:
データ処理方法の比較分析を行い、ファインチューニングされたトランスフォーマーモデルがADE関連タスクにおいて良好な性能を示しました。特に、スプリットベースアプローチを採用したClinical-Longformerモデルは、ADE検出の実用的な実装において大きな可能性を示しました。トークン制限が重要である一方で、テキストの長さがトークン制限内であっても、チャンクサイズがモデルの性能に大きく影響することが分かりました。

結論:
トランスフォーマーベースのモデルを用いた臨床ノートからのADE検出のためのモデル開発におけるデータ処理方法に関するガイダンスを提供しました。二つのデータセットにおける結果から、臨床ノートのタイプと、アノテーションおよびモデルのファインチューニングにおける人的および計算資源の配分のトレードオフに基づいて、データ処理方法とモデルを慎重に選択する必要があることが示されました。

Developing a natural language processing system using transformer-based models for adverse drug event detection in electronic health records
Wu, J., Ruan, X., McNeer, E., Rossow, K. M., Choi, L. 2024-07-10 http://medrxiv.org/cgi/content/short/2024.07.09.24310100v1

下記の文章は論文アブストラクトをもとに Retrieval-Augmented Language Modeling (RALM) により生成された文章であり、正確性は保証しません。

Question 9: 文脈として与えられた最新論文の内容を、背景、新規性、方法などに分けて、詳しく説明してください。

この論文では、心電図(ECG)を用いた心臓疾患、特に不整脈の非侵襲的な識別方法について述べています。近年、人工知能と機械学習の分野が医療応用において顕著な進展を遂げており、深層学習技術を用いた不整脈の分類器の開発が進んでいます。

【背景】
不整脈は心臓の異常なリズムであり、ECGはこれを識別するための重要なツールです。しかし、強固で信頼性の高い機械学習モデルを構築・評価するためには、大規模でよく注釈されたECGデータセットが必要ですが、これが限られているという課題があります。

【新規性】
この論文は、限られたトレーニングデータセットで効果的に機能する新しいディープトランスファーラーニングフレームワークを提案しています。具体的には、一般的な画像分類器であるResNet-18を、MIT-BIH不整脈データセットを使用して微調整する方法を採用しています。このアプローチは、限られたデータの可用性の制約を克服するために、トランスファーラーニングの力を活用することを目指しています。

【方法】
ResNet-18モデルを基に、MIT-BIH不整脈データセットを用いてモデルを微調整します。これにより、事前に学習されたモデルの知識を新しいデータセットに適用し、限られたデータからでも学習が可能になります。

さらに、この論文では、ECG分析の分野における既存の深層学習モデルを批判的に検討しています。調査の結果、多くのモデルがデータリークという方法論的な欠陥を抱えており、これが過度に楽観的なパフォーマンス評価を導き出し、これらのモデルの信頼性や実世界での一般化能力についての懸念を引き起こしていることが明らかになりました。

【結論】
この研究は、より堅牢で信頼性の高いECG分析技術の進歩に貢献し、臨床設定における自動不整脈検出の精度と適用性を向上させる可能性があります。

TLFT: Transfer Learning and Fourier Transform for ECG Classification
Wang, E., Lee, S. 2024-07-10 http://medrxiv.org/cgi/content/short/2024.07.09.24310152v1

下記の文章は論文アブストラクトをもとに Retrieval-Augmented Language Modeling (RALM) により生成された文章であり、正確性は保証しません。

Question 10: 文脈として与えられた最新論文の内容を、背景、新規性、方法などに分けて、詳しく説明してください。

背景: ランダム化比較試験(RCT)からサンプルサイズを抽出することは、より良い検索機能の開発やシステムレビューの自動化に向けての課題である。現在のアプローチの多くは、サンプルサイズが抄録に明示的に記載されている場合に依存している。

新規性: この研究では、サンプルサイズが明示的に記載されていない場合でも、サンプルサイズを予測するための名前付きエンティティ認識(NER)モデルを訓練し、評価することを試みた。これは、各腕の患者数を加算するなどして計算することが可能である。

方法: 高影響度の医学雑誌から選ばれた847件のRCTを対象に、サンプルサイズを示す可能性のある6つの異なるエンティティでタグ付けを行った。その後、これらのエンティティを抽出するためのNERモデルを訓練し、150件のRCTを含むテストセットでデプロイした。試験参加者の実際の数を予測するためのエンティティのパフォーマンスを評価し、予測モデルを作成するためのエンティティの組み合わせを検討した。

結果: 最も正確なモデルはテストセットの64.7%の試験に対して予測を行うことができ、その予測は96.9%のケースで基準値の10%以内に収まった。より緩いモデルでは96.0%の試験に対して予測を行うことができ、その予測は88.2%のケースで基準値の10%以内に収まった。

結論: NERモデルを訓練してRCTからサンプルサイズを予測することは実現可能であり、サンプルサイズが明示的に記載されている場合だけでなく、計算によってサンプルサイズを求めることができる場合にも有効であることが示された。

Extracting the Sample Size From Randomized Controlled Trials in Explainable Fashion Using Natural Language Processing
Windisch, P., Dennstaedt, F., Koechli, C., Foerster, R., Schroeder, C., Aebersold, D. M., Zwahlen, D. R. 2024-07-10 http://medrxiv.org/cgi/content/short/2024.07.09.24310155v1

下記の文章は論文アブストラクトをもとに Retrieval-Augmented Language Modeling (RALM) により生成された文章であり、正確性は保証しません。

Question 11: 文脈として与えられた最新論文の内容を、背景、新規性、方法などに分けて、詳しく説明してください。

背景:
この研究の目的は、一次性アルドステロン症(PA)の予測モデルを二次性高血圧の意思決定支援ツールに追加することで、一次診療の場においてPAのスクリーニングが増加するかどうかを決定することです。PAは現在、臨床現場で十分にスクリーニングされていない状態です。

新規性:
従来の臨床意思決定支援ツールに、スクリーニングが不十分な状態のための予測モデルを追加することにより、これらの状態のスクリーニングを増加させる可能性があります。これは、PAのような条件での早期発見と治療を改善するための新しいアプローチを提供します。

方法:
研究は、2023年8月から2024年4月にかけて、153の一次診療クリニックを無作為に割り当て、二次性高血圧の意思決定支援ツールを予測モデルが組み込まれているかどうかで受け取るグループに分けました。参加者は、リスクスコアが上位1パーセンタイルに入る患者を対象に、モデルクリニックでアラートが表示されると注文セットが起動されるシステムでした。その結果、モデルクリニックではARR(アルドステロン/レニン比)の注文が行われる確率が高くなりました。

結果:
上位1パーセンタイルのリスクスコアを持つ患者では、モデルクリニックでのアラート表示があった2,896人のうち63人(2.2%)が注文セットを起動し、モデルなしクリニックでは1,210人のうち12人(1.0%)がそれを起動しました(P = 0.014)。また、モデルクリニックでは2,896人中19人(0.66%)がARRを注文しましたが、モデルなしクリニックでは1,210人中0人(0.0%)でした(P = 0.010)。上位1パーセンタイル以外のスコアを持つ患者では、モデルクリニックの20,493人中438人(2.1%)が注文セットを起動し、モデルなしクリニックの17,820人中273人(1.5%)がそれを起動しました(P < 0.001)。また、モデルクリニックでは20,493人中124人(0.61%)がARRを注文しましたが、モデルなしクリニックでは17,820人中34人(0.19%)でした(P < 0.001)。

結論:
PA予測モデルの追加は、二次性高血圧のアラート表示とトリガー基準、注文セット表示および注文事前選択基準により、統計的かつ臨床的に有意なPAスクリーニングの増加をもたらします。

The Impact of a Primary Aldosteronism Predictive Model in Secondary Hypertension Decision Support
Mack, P. B., Cole, C., Lee, M., Peterson, L., Lundy, M., Hegarty, K. E., Espinoza, W. 2024-07-10 http://medrxiv.org/cgi/content/short/2024.07.09.24310088v1

下記の文章は論文アブストラクトをもとに Retrieval-Augmented Language Modeling (RALM) により生成された文章であり、正確性は保証しません。

Question 12: 文脈として与えられた最新論文の内容を、背景、新規性、方法などに分けて、詳しく説明してください。

この論文では、アメリカ合衆国だけで2024年に推定125,070人が死亡するとされる肺がんの増加に対処するために、肺結節の良性と悪性を識別するための支援として、早期二値検出のための畳み込みニューラルネットワーク(CNN)モデルを開発し、その効果を他のアプローチと比較して評価しました。

【背景】
肺がんは増加傾向にあり、早期発見が非常に重要です。肺結節の良性と悪性を区別することは、適切な治療法を早期に適用するために不可欠です。しかし、従来の方法では精度に限界があり、より効果的な手法が求められていました。

【新規性】
この研究では、肺結節の早期二値検出のためにCNNモデルを用いることが試みられました。CNNは画像認識において高い精度を示すことが知られており、医療画像の分析にも応用され始めています。本研究で開発されたCNNモデルは、従来の放射線学ベースのSVM-LASSOモデルやLung-RADSシステムと比較して、高い精度を示しました。

【方法】
研究では、肺結節の画像データを用いて、CNNモデルを訓練しました。モデルの有効性を評価するために、実際の患者データに適用し、その結果をSVM-LASSOモデルおよびLung-RADSシステムの結果と比較しました。CNNモデルは98.47%の精度を達成し、他のモデルよりも明らかに高い効果を示しました。

【結論】
本論文は、AIが肺がんの早期発見に有効であることを示していますが、AIの医療への適用や影響については、さらなる研究が必要であると結論づけています。AIの進化が医療分野でどのように利用されるか、その潜在的な利点とリスクを慎重に評価することが重要です。

EARLY LUNG CANCER SCREENING: A COMPARATIVE STUDY OF CNN AND RADIOMICS MODELS WITH PULMONARY NODULE BIOLOGIC CHARACTERIZATION
Gupta, M., Fandy, E. V., Ghindani, K. 2024-07-10 http://medrxiv.org/cgi/content/short/2024.07.06.24309995v1

下記の文章は論文アブストラクトをもとに Retrieval-Augmented Language Modeling (RALM) により生成された文章であり、正確性は保証しません。

Question 13: 文脈として与えられた最新論文の内容を、背景、新規性、方法などに分けて、詳しく説明してください。

この論文では、人工知能(AI)技術を臨床実践に統合することが、医療を革命的に変える大きな可能性を持っていると述べています。しかし、その潜在能力を実現するためには、AIアプリケーションの安全性、有効性、臨床的意義を保証するために厳格な評価と検証が必要です。AI関連のランダム化比較試験(RCT)には、一般化と臨床設定への適切な統合を妨げる顕著な限界があるという認識が高まっていますが、これまでのところ多くのRCTがそのような限界を示しています。

この研究では、医療分野のAIに関連する進行中および計画中のRCTの登録データをClinicaltrials.govデータベースで分析しています。この分析からはいくつかの主要な傾向と課題が明らかになります。これらの課題に効果的に対処することは、医療AI分野を前進させ、臨床実践への成功した統合を保証するために不可欠です。

背景としては、AI技術が医療において重要な役割を果たす可能性があるにもかかわらず、その臨床試験における一般化の問題が指摘されています。新規性としては、進行中および計画中のRCTの包括的な分析を通じて、現在の医療AIの試験の傾向と課題を明らかにしています。方法としては、Clinicaltrials.govデータベースを用いた登録データの分析が行われており、これによりAIの臨床試験における現状と問題点が詳細に調査されています。

このように、この論文は医療分野におけるAI技術の統合に向けた現在の進捗と課題を詳細に分析し、その結果をもとに今後の方向性を提案しています。

Ongoing and planned Randomized Controlled Trials of AI in medicine: An analysis of Clinicaltrials.gov registration data
andreoletti, m., Senkalfa, B., Blasimme, A. 2024-07-09 http://medrxiv.org/cgi/content/short/2024.07.09.24310133v1

下記の文章は論文アブストラクトをもとに Retrieval-Augmented Language Modeling (RALM) により生成された文章であり、正確性は保証しません。

Question 14: 文脈として与えられた最新論文の内容を、背景、新規性、方法などに分けて、詳しく説明してください。

この研究では、アルツハイマー病(AD)の進行における性別特有のサブフェノタイプを明らかにするために、オートエンコーダーを利用しています。以下にその内容を背景、新規性、方法の観点から詳しく説明します。

【背景】
アルツハイマー病は、性差の影響を大きく受ける複雑な神経変性疾患であり、患者の約2/3が女性です。性別に特有なADの進行パターンを特徴づけ、その進行軌道を特定することは、効果的なリスク分類と予防戦略を開発するために重要です。

【新規性】
この研究の新規性は、長期にわたる電子健康記録(EHR)データを活用して、性別に基づいたADの進行におけるサブフェノタイプを特定する点にあります。特に、性別で分類されたADコホートからの縦断的EHRを用いて、時系列の患者表現を構築しました。これにより、性別特有のAD進行パターンだけでなく、女性と男性のAD発展における臨床的特徴や共存症の違いも明らかにしています。

【方法】
まず、性別に分けられたADコホートからの縦断的EHRを用いて、患者の時系列表現を構築しました。次に、LSTM(Long Short-Term Memory)ベースのオートエンコーダーを使用して、患者の連続的な臨床記録から潜在表現の埋め込みを抽出・生成しました。その後、学習された表現に階層的凝集クラスタリングを適用し、進行サブフェノタイプに基づいて患者をグループ化しました。実験結果から、高い信頼度で5つの主要な性別ベースのADサブフェノタイプとそれに対応する進行経路を特定することに成功しました。

これらの発見は、個別化されたAD介入や治療戦略を進めるための貴重な洞察を提供する可能性があります。

Autoencoder to Identify Sex-Specific Sub-phenotypes in Alzheimer's Disease Progression Using Longitudinal Electronic Health Records
Meng, W., Xu, J., Huang, Y., Wang, C., Song, Q., Ma, A., Song, L., Bian, J., Ma, Q., Yin, R. 2024-07-08 http://medrxiv.org/cgi/content/short/2024.07.07.24310055v1

下記の文章は論文アブストラクトをもとに Retrieval-Augmented Language Modeling (RALM) により生成された文章であり、正確性は保証しません。

Question 15: 文脈として与えられた最新論文の内容を、背景、新規性、方法などに分けて、詳しく説明してください。

この研究は、複数の身体的疾患を持つ人々が後にうつ病を発症するリスクが高いかどうかを調査することを目的としています。以下は、その研究内容を背景、新規性、方法という観点から詳しく説明したものです。

【背景】
多重疾患(multimorbidity)とは、個々の人において二つ以上の健康問題が同時に発生する状態を指します。このような状態は、医療提供や研究にとって大きな課題であり、特に身体的健康と精神的健康の両方に問題がある場合が重要視されています。この研究の目的は、身体的多重疾患とその後のうつ病との関連を調査することです。

【新規性】
この研究の新規性は、大規模なデータセット(UK Biobank参加者)を使用し、異なるクラスタリング手法を用いて身体的疾患のパターンを分析し、それらが後のうつ病発症とどのように関連しているかを明らかにした点にあります。特に、4つの異なるクラスタリング手法(階層的クラスタリング、潜在クラス分析、k-medoids、k-modes)を比較し、最も性能が良かったk-modesモデルを選択しています。

【方法】
研究では、2006年から2010年の間に基本データ収集が行われた37歳から73歳のUK Biobank参加者の身体的疾患データに基づいてクラスタリング分析を実施しました。参加者502,353人のうち、142,005人が少なくとも一つの身体的状態を持つ一般診療データとリンクしていました。性別による層別後(女性77,785人、男性64,220人)、上記のクラスタリング手法を用いて分析し、クラスタリングメトリクスに基づいて最良の方法を選択しました。各クラスタ内での状態の過剰/過小表現をFishers Exact testで評価しました。うつ病の既往がない人々を対象に、クラスターのメンバーシップとその後のうつ病診断までの時間との関連を生存分析を用いて推定しました。

これらの方法を通じて、身体的多重疾患の特定のグループが後のうつ病のリスクを高める可能性があることが示されましたが、身体的多重疾患とうつ病を結びつける他の要因、例えば社会的要因などについてもさらなる調査が求められています。

Investigating associations between physical multimorbidity clusters and subsequent depression: cluster and survival analysis of UK Biobank data
DeLong, L. N., Fleetwood, K., Prigge, R., Galdi, P., Guthrie, B., Fleuriot, J. D. 2024-07-07 http://medrxiv.org/cgi/content/short/2024.07.05.24310004v1

下記の文章は論文アブストラクトをもとに Retrieval-Augmented Language Modeling (RALM) により生成された文章であり、正確性は保証しません。

Question 16: 文脈として与えられた最新論文の内容を、背景、新規性、方法などに分けて、詳しく説明してください。

この論文は、心臓手術後の発生率が高い心房細動(POAF)に焦点を当てています。POAFは患者の予後に悪影響を与えることが知られています。これまでに、POAFを予測するためのリスクスコアリングツールが開発されてきましたが、その識別性能は中程度に留まっています。

【背景】
心臓手術後のPOAFは一般的であり、患者の結果に悪影響を及ぼす可能性があります。従来のリスクスコアリングツールでは、POAFの予測性能が完全ではないため、より高い性能を持つ予測モデルの開発が求められています。

【新規性】
この研究では、機械学習(ML)モデルを用いてPOAFのリスク評価を行うことの有効性を検証しています。特に、電子健康記録から得られた異質なコホートに対して、8つのリスクスコアリングツールと6つのMLモデルを評価し、MLモデルがより高い識別性能を達成していることを示しています。

【方法】
研究では、電子健康記録から抽出された異質な患者集団を使用し、既存のリスクスコアリングツールと新たに提案されたMLモデルの性能を比較しました。評価指標としては、モデルの識別性能(どれだけ正確にPOAFを予測できるか)と公平性(人種や性別のサブグループ間での性能の均一性)を検討しています。

【結論】
MLモデルは、リスクスコアリングツールに比べて高い識別性能を示すものの、人種に関しては公平性が低いことが明らかになりました。このため、正確で公平なMLモデルの構築が、POAFリスクの一貫性のある公平な評価を促進するために必要であると結論付けています。

この研究は、POAFの予測におけるMLモデルの利点と限界を明らかにし、今後の研究での改善に向けた指針を提供しています。

Machine learning is more accurate and biased than risk scoring tools in the prediction of postoperative atrial fibrillation after cardiac surgery
Ho, J. C., Joshi, S., Valverde, E., Wood, K., Grubb, K. J., Leal, M. A., Hertzberg, V. S. 2024-07-07 http://medrxiv.org/cgi/content/short/2024.07.05.24310013v1

下記の文章は論文アブストラクトをもとに Retrieval-Augmented Language Modeling (RALM) により生成された文章であり、正確性は保証しません。

Question 17: 文脈として与えられた最新論文の内容を、背景、新規性、方法などに分けて、詳しく説明してください。

この論文では、新生児集中治療室(NICU)において、新生児の診断を迅速に行うための臨床支援ツールとして、メンデル遺伝表現型検索エンジン(MPSE)が導入されたことが紹介されています。このツールは自然言語処理と機械学習を使用しており、新生児の遺伝子診断において重要な役割を果たしています。

背景として、新生児集中治療室では、新生児の疾患の診断に時間がかかることが問題とされていました。従来の診断方法では、遺伝子の変異を特定するために長時間を要し、治療の遅れにつながることがあります。

新規性として、MPSEは自然言語処理と機械学習の技術を活用して、新生児の症状や表現型から迅速に遺伝的変異を推測し、全ゲノム配列決定(WGS)の決定を加速することができます。これにより、診断までの時間が短縮され、治療への迅速な移行が可能になります。

方法として、MPSEは新生児の臨床情報を入力として受け取り、関連する遺伝子変異を予測するアルゴリズムを使用しています。このシステムは、遺伝子の変異と症状の関連を学習し、新生児に最も適した遺伝子検査の選択を支援します。

結果として、MPSEの導入後、WGSの利用率が向上し、WGSの注文までの時間が短縮され、WGSの診断効率が向上しました。これにより、新生児の治療がより迅速かつ効果的に行われるようになり、新生児の健康と生存率の向上に貢献しています。

この研究は、新生児の遺伝子診断における新たなアプローチを提供するものであり、臨床現場における遺伝子診断の効率化と精度向上に寄与する重要な成果です。

A Machine Learning Decision Support Tool Optimizes Whole Genome Sequencing Utilization in a Neonatal Intensive Care Unit
Juarez, E. F., Peterson, B., Sanford Kobayashi, E., Gilmer, S., Tobin, L. E., Schultz, B., Lenberg, J., Carroll, J., Bai-Tong, S., Sweeney, N. M., Beebe, C., Stewart, L., Olsen, L., Reinke, J., Kiernan, E. A., Reimers, R., Wigby, K., Tackaberry, C., Yandell, M., Hobbs, C., Bainbridge, M. N. 2024-07-07 http://medrxiv.org/cgi/content/short/2024.07.05.24310008v1

下記の文章は論文アブストラクトをもとに Retrieval-Augmented Language Modeling (RALM) により生成された文章であり、正確性は保証しません。

Question 18: 文脈として与えられた最新論文の内容を、背景、新規性、方法などに分けて、詳しく説明してください。

背景:
この研究は、デジタルツインの開発を促進する生成型人工知能(AI)に焦点を当てています。デジタルツインは、実際の患者の仮想表現を可能にし、患者の健康軌道を探索、予測、シミュレーションすることで、治療選択や臨床試験の設計などに役立ちます。特に大規模言語モデル(LLM)を利用した最近の予測技術の進歩は、データの欠落、ノイズ、限られたサンプルサイズなど、実世界データ(RWD)の課題を克服する未開拓の可能性を示しています。

新規性:
本研究で開発されたデジタルツイン - 生成型事前訓練トランスフォーマー(DT-GPT)モデルは、豊富な電子健康記録(EHR)データを使用して生物医学的LLMを活用します。この方法は、データの補完や正規化の必要を排除し、臨床変数の予測や、チャットボットインターフェースを通じた予測探索を可能にします。

方法:
DT-GPTモデルの性能は、長期的な全米非小細胞肺癌(NSCLC)データセットと、短期的な集中治療室(MIMIC-IV)データセットの実世界データ(RWD)に基づいて分析されました。DT-GPTは、平均絶対誤差(MAE)で既存の最先端の機械学習方法を上回り、臨床変数の相互相関を保持し(平均R2は0.98)、データの欠落やノイズを扱う能力を示しました。さらに、DT-GPTは予測の根拠を提供し、ファインチューニング中に使用されなかった変数に対するゼロショット予測を行う能力も発見されました。

解釈:
DT-GPTはLLMが堅牢な医療予測プラットフォームとして機能することを示し、訓練データを超えた患者特性を仮想的に再現できるデジタルツインを実現します。LLMベースのデジタルツインは、臨床試験シミュレーション、治療選択、副作用の緩和など、さまざまな用途に役立つと考えられます。

Large Language Models forecast Patient Health Trajectories enabling Digital Twins
Makarov, N., Bordukova, M., Rodriguez-Esteban, R., Schmich, F., Menden, M. P. 2024-07-07 http://medrxiv.org/cgi/content/short/2024.07.05.24309957v1

下記の文章は論文アブストラクトをもとに Retrieval-Augmented Language Modeling (RALM) により生成された文章であり、正確性は保証しません。

Question 19: 文脈として与えられた最新論文の内容を、背景、新規性、方法などに分けて、詳しく説明してください。

この研究は、イギリスでの肺がんの早期診断を目的としたものであり、その背景には肺がんが診断が遅れがちであるために最も死亡原因となっている点があります。従来の予測モデルでは電子健康記録(EHR)の時間的な関連性を考慮していなかったため、予測精度が低かった(PPVが10%未満)とされています。この問題を解決するために、本研究ではディープラーニング、特にトランスフォーマーモデルを用いて、EHRデータからの時間的関連性を学習し、肺がん診断のためのモデルを構築しました。

【新規性】
本研究の新規性は、肺がん診断のために、一般的な回帰モデルではなく、トランスフォーマーベースのディープラーニングモデル「MedAlbert」をプレトレーニングし、EHRデータからの患者の病歴の深い表現を学習する点にあります。これにより、単なるデータ集約ではなく、詳細な臨床記録に基づいてモデルを構築した最初の例となります。また、MedAlbert+LRCモデルは、感度、特異性、PPV、AUROCの面で従来の機械学習モデルよりも優れた性能を示しました。

【方法】
この研究では、WSICデータセット内のネストされたケースコントロール研究を実施し、肺がんのケースと他のがんや呼吸器条件のコントロールケースを特定しました。診断日から3年間のGP EHRデータを使用し、最新の1か月を除いてセマンティックに前処理を行い、30,000以上の用語から450にマッピングしました。モデル構築は、ALBERTとロジスティック回帰分類器(LRC)を使用し、k-meansによるクラスタリングも探索されました。データは70%をトレーニング用、30%を検証用に分割しました。

【結果と解釈】
MedAlbert+LRCモデルは、診断前3年間のデータに基づいてAUROCが0.924、PPVが3.6%、感度が86.6%と非常に高い性能を示しました。これにより、がんと非がんの診断パス間の時間的シーケンスを捉えることで、より正確なモデルが可能になることが示されました。今後の研究では、外部データセットの検証とGP臨床システムへの統合が焦点となります。

【研究の意義】
この研究により、単純な赤旗に基づく紹介ガイダンスを超えて、より正確な肺がんの早期診断モデルの開発が可能となります。さらに、設計したフレームワークは他のがんや疾患の予測にも使用可能です。肺がんの早期診断の改善は、がんの結果と生存率を向上させることに寄与するでしょう。

Transformer-based deep learning model for the diagnosis of suspected lung cancer in primary care based on electronic health record data
Wang, L., Yin, Y., Glampson, B., Peach, R. L., Barahona, M., Delaney, B. C., Mayer, E. 2024-07-05 http://medrxiv.org/cgi/content/short/2024.07.02.24309824v1

下記の文章は論文アブストラクトをもとに Retrieval-Augmented Language Modeling (RALM) により生成された文章であり、正確性は保証しません。

Question 20: 文脈として与えられた最新論文の内容を、背景、新規性、方法などに分けて、詳しく説明してください。

背景:
本研究は、人工知能(AI)が患者ケアのさまざまな側面に取り入れられる中で、透明性と信頼性のある実装を確保する方法についての理解を深めることに関心が高まっています。しかし、その使用の透明性を促進するために患者が必要とする情報についてはあまり注意が払われていません。

新規性:
この研究は、心血管ケアにおけるAIの使用に焦点を当て、AIの信頼と採用に対する患者の情報ニーズについて議論するために、アメリカ全土の42人の患者と3つの非同時オンラインフォーカスグループを実施しました。これにより、患者がAIシステムに対する信頼を調整するためにどのような情報が必要かを特定することが重要な出発点となります。

方法:
データは迅速な内容分析アプローチを使用して分析されました。この研究では、AIモデル、監督、および医療経験に関連する具体的な情報要因を含む一連の核心情報ニーズが存在することが示唆されています。また、情報提供、開示、同意、および医師のAI使用に関する視点も考慮されています。

結論:
患者の情報ニーズを特定することは、医療AIシステムにおける信頼を調整し、情報提供戦略を設計するための重要な出発点です。これらの発見は、透明な医療AIのアプローチを考慮する際に、患者中心のエンゲージメントの重要性を強調しています。

Patient information needs for transparent and trustworthy artificial intelligence in healthcare
Stroud, A. M., Minteer, S. A., Zhu, X., Ridgeway, J. L., Miller, J. E., Barry, B. A. 2024-07-03 http://medrxiv.org/cgi/content/short/2024.07.02.24309850v1

下記の文章は論文アブストラクトをもとに Retrieval-Augmented Language Modeling (RALM) により生成された文章であり、正確性は保証しません。

Question 21: 文脈として与えられた最新論文の内容を、背景、新規性、方法などに分けて、詳しく説明してください。

背景:臨床データウェアハウス(CDWs)の発展により、医療研究におけるビッグデータへのアクセスが大幅に増加しています。しかし、異なるデータモデル間での標準化の欠如が相互運用性を阻害し、これらの広大なデータリソースの研究ポテンシャルを制限しています。さらに、データの操作や分析には高度なプログラミングスキルが必要であり、多くの医療専門家はこのスキルセットを持っていません。

新規性:これらの問題に対処するために、我々はオープンソースでローコード、協調的なデータサイエンスプラットフォームを作成しました。このプラットフォームは、グラフィカルツールと高度なプログラミングインターフェースを使用して、医療データの操作、視覚化、分析を行うことができます。このソフトウェアはOMOP共通データモデルに基づいています。

方法:LinkRは、複数のソースからインポートされたデータを使用して研究を生成することができます。ソフトウェアは研究を個人データセクションと集団データセクションの2つの主要なセクションに編成します。個人データセクションでは、ユーザーフレンドリーなグラフィカルツールを使用してデータの表示をカスタマイズし、研究のニーズに応じて医療記録の同等物を再現することができます。集団データセクションは、グラフィカルおよびプログラミングインターフェースを通じて統計分析を行うために設計されています。また、アプリケーションにはメッセージページや統合Gitモジュールなどの協力的な機能も組み込まれており、異なる研究センター間での効率的な協力と共有データ分析の努力を促進します。

結論:LinkRは、臨床データウェアハウスからのデータのアクセス、操作、分析を民主化し、オープンサイエンスアプローチを使用して医療データの協同作業を促進するローコードデータサイエンスプラットフォームです。

LinkR: an open source, low-code and collaborative data science platform for healthcare data analysis and visualization
Delange, B., Popoff, B., Seite, T., Lamer, A., Parrot, A. 2024-07-03 http://medrxiv.org/cgi/content/short/2024.07.03.24309872v1

下記の文章は論文アブストラクトをもとに Retrieval-Augmented Language Modeling (RALM) により生成された文章であり、正確性は保証しません。

Question 22: 文脈として与えられた最新論文の内容を、背景、新規性、方法などに分けて、詳しく説明してください。

本研究の目的は、ICD-10-CMコードマッピングのための検索プロセスを改善することにより、自動医療コーディング(AMC)を強化することです。これは、効果的な医療管理に不可欠な一貫性と正確な医療コーディング習慣を達成することが重要であるためです。

【背景】
医療コーディングは、診断、手順、サービスを正確に記録し、医療の質を管理し改善するための基本的なプロセスです。ICD-10-CMコードは、病気や治療の国際的な分類であり、正確なコーディングは報告、統計、経済的な評価に直接影響します。しかし、診断の記述が曖昧であることが多く、コーディングの誤りが生じることがあります。

【新規性】
この研究は、最新の埋め込みモデルが意味的類似性をどの程度捉え、ICD-10-CMコードの検索プロセスをどのように改善できるかを評価することに焦点を当てています。特に、ClinicalBERTなどの専門化されたモデルと比較して、これらのモデルの有効性を検証することが新規性です。

【方法】
研究では、text-embedding-3-large、text-embedding-004、voyage-large-2-instruct、mistralembedなどの埋め込みモデルをClinicalBERTと比較しました。これらのモデルは、eICUデータベースからの診断文字列を正確なICD-10-CMコードにマッピングするための検索プロセスを改善する能力と、長いおよび短いICD-10-CMの説明間の意味的類似性を捉える能力を評価するために使用されました。

【結果】
text-embedding-3-largeとtext-embedding-004モデルは、意味的類似性を捉える能力においてClinicalBERTを上回り、text-embedding-3-largeが最も高い正確性を達成しました。ICD-10コードの検索においては、voyage-large-2-instructモデルが最も優れたパフォーマンスを示しました。最も良い結果を得るためには、最近傍の15個の隣人を使用することが最適でした。この数を増やしても、意味のある情報が不足しているため、正確性は向上しませんでした。

【結論】
最新の埋め込みモデルは、AMCタスクにおいてClinicalBERTのような専門化されたモデルよりも大幅に優れています。これらの発見は、診断の記述が曖昧であるという課題にもかかわらず、これらのモデルが医療コーディング実践を強化する可能性を強調しています。

Enhancing Automated Medical Coding: Evaluating Embedding Models for ICD-10-CM Code Mapping
klotzman, v. 2024-07-03 http://medrxiv.org/cgi/content/short/2024.07.02.24309849v1

下記の文章は論文アブストラクトをもとに Retrieval-Augmented Language Modeling (RALM) により生成された文章であり、正確性は保証しません。

Question 23: 文脈として与えられた最新論文の内容を、背景、新規性、方法などに分けて、詳しく説明してください。

この論文では、健康リテラシーが個人が医療システムを理解し、健康に関する意思決定を行う上で重要であることが述べられています。特に、年齢が高い人々や経済的に制約がある人々、教育水準が低い人々の間で、健康リテラシーの低さがネガティブな健康結果と関連しているとされています。この問題に対処するための有効なツールとして、生物医学及び臨床文書の内容を簡素化する「プレーン言語要約(PLS)」が提案されています。

【背景】
健康リテラシーの低さは、医療情報の理解が困難であり、適切な健康管理や医療決定を行う上で障害となっています。PLSは、専門的な医療文書を一般の人々も理解できる形に簡略化することで、このギャップを埋める手段として有効ですが、PLSの作成は時間がかかり、専門知識を要するため、必要としている人々に十分に提供されていません。

【新規性】
この研究の新規性は、自然言語処理(NLP)と大規模言語モデル(LLM)、特にGenerative Pre-trained Transformer (GPT) 3.5とGPT 4を利用して、生物医学テキストからPLSを自動生成する方法を体系的に評価した点にあります。これにより、PLSの作成プロセスを効率化し、より広範なアクセスを可能にすることを目指しています。

【方法】
研究ではまず、NLPを用いてテキストがプレーン言語で書かれているかどうかを判定する分類モデルを開発し、その精度は97.2%に達しました。次に、最新のLLMであるGPT 4を使用して、生物医学テキストからPLSを自動生成し、そのセマンティックな等価性、正確性、読みやすさ、完全性、有用性をドメインの専門家が生成したPLSと比較しました。

【結果と意義】
GPT 4は、専門家が作成したPLSと同等の、高い評価を受けるPLSを成功裏に生成しました。これにより、LLMとNLPを使用して生物医学テキストをプレーン言語要約に翻訳する価値が示され、医療関係者が患者や一般の人々を支援し、健康情報を理解し、情報に基づいた医療決定を行うための支援ツールとしての可能性が示唆されました。

Bridging the Gap in Health Literacy: Harnessing the Power of Large Language Models to Generate Plain Language Summaries from Biomedical Texts
Salazar-Lara, C., Arias Russi, A. F., Manrique, R. 2024-07-03 http://medrxiv.org/cgi/content/short/2024.07.02.24309847v1

下記の文章は論文アブストラクトをもとに Retrieval-Augmented Language Modeling (RALM) により生成された文章であり、正確性は保証しません。

Question 24: 文脈として与えられた最新論文の内容を、背景、新規性、方法などに分けて、詳しく説明してください。

この論文は、アフリカの公衆衛生における自然言語処理(NLP)技術の現状と展望を探るためのスコーピングレビューを行うことを目的としています。

【背景】
自然言語処理(NLP)は、テキスト分析や言語生成などのタスクを容易にするために、コンピュータが人間の言語を処理するための計算技術の範囲を研究する分野です。最近のNLPの進歩は、アクセシビリティ、パーソナライゼーション、タイムリネスの向上により、公衆衛生の提供を変革する可能性を示しています。しかし、アフリカのコミュニティでのこれらの技術の応用は、大規模なドメイン固有のデータセットなどのデジタルリソースの不足という制限によってしばしば制約されています。

【新規性】
このレビューは、アフリカにおける公衆衛生のためのNLP技術の現状を体系的に探ることに焦点を当てています。これにより、利用可能な技術、その利用可能性に影響を与える要因、そして対処が必要なギャップを特定します。

【方法】
このレビューはPRISMA-Pステートメントに基づいて指導されます。検索戦略は、MEDLINE(PubMed経由)、ACL Anthology、Scopus、IEEE Xplor、ACMデジタルライブラリを通じて実行され、2013年から2024年までの期間とグレーリテラチャーに及びます。この結果と分析は、アフリカの公衆衛生設定におけるNLPアプリケーションの現状を示し、投資と開発が必要な重要な領域を特定するのに役立ちます。

このように、この論文はアフリカにおける公衆衛生分野でのNLP技術の利用と展開の現状を明らかにし、今後の発展のための具体的な提案を行うことを目指しています。

Review Protocol: A Scoping Review of Natural Language Processing Technologies for Public Health in Africa
Hu, S., Oppong, A., Mogo, E., Barford, A., Occhini, G., Collins, C., Korhonen, A. 2024-07-03 http://medrxiv.org/cgi/content/short/2024.07.02.24309815v1

下記の文章は論文アブストラクトをもとに Retrieval-Augmented Language Modeling (RALM) により生成された文章であり、正確性は保証しません。

Question 25: 文脈として与えられた最新論文の内容を、背景、新規性、方法などに分けて、詳しく説明してください。

この論文では、リウマチ性関節炎に対する治療法に関する医学的議論を分析しています。この研究は、科学的な発表における仮説や結果の提示方法がどのように偏りを持っているか、そしてそれがどのように異なる背景、重要性、堅牢性、そして聴衆が当然と考えるべき前提に異なる強調を与えるかを分析することを目的としています。

背景として、この論文は医学的議論の分析が社会人類学では広く研究されている一方で、研究を行っている科学コミュニティ内では一般的に見過ごされがちであると指摘しています。この議論の分析は、広範な医療機会を考慮に入れた政策を策定するため、有望だがあまり注目されていない道を見落とさないため、病気、治療法、患者、その他の関係者の異なる表現を理解するために重要です。

新規性として、この研究はトピックモデリングと大規模言語モデルに基づく感情分析と感情分析を用いて、医学的議論を補完的に分析する方法を提案しています。これにより、広大で絶えず成長している医学文献の体系的な探索が可能となります。

方法として、伝統的に社会人類学者が手動のキュレーション方法を使用しているのに対し、この研究では自動化されたアプローチであるトピックモデリングを採用しています。これにより、医学的議論の多様な側面を効率的に解析することができます。さらに、大規模言語モデルを用いた感情分析と感情分析を組み合わせることで、文献に表れる感情やセンチメントの変動も評価しています。

以上のように、この論文は医学的議論の分析を通じて、医学研究の発表と受容の仕方に潜む偏りを明らかにし、より公正で多角的な医療政策の策定を目指しています。

Large-scale analysis of the medical discourse on rheumatoid arthritis: complementing a socio-anthropologic analysis
Santoro, M., Nardini, C. 2024-07-03 http://medrxiv.org/cgi/content/short/2024.07.02.24309823v1

下記の文章は論文アブストラクトをもとに Retrieval-Augmented Language Modeling (RALM) により生成された文章であり、正確性は保証しません。

Question 26: 文脈として与えられた最新論文の内容を、背景、新規性、方法などに分けて、詳しく説明してください。

この研究では、精神医学のジャーナルにおける薬物療法と非薬物療法の介入に関する原著論文において、結果がどの程度「スピン」(研究結果を客観的評価よりも肯定的に誤って表現すること)されているかを評価することが目的です。

背景
スピンは、研究結果を公表する際に、客観的な評価よりも肯定的に誤って表現する一般的なバイアスの形式であり、これが精神医学のジャーナルにどれだけ存在するかは未知数です。スピンの存在は、臨床実践に誤解を招く可能性があります。

新規性
この研究は、大規模言語モデル(GPT4-turbo)を使用して、精神医学のジャーナルにおける薬物療法及び非薬物療法の介入に関する原著報告のスピンの程度を特徴づけることを試みます。これにより、スピンを自動的に検出し、将来の出版物でのスピンを最小限に抑えるための改訂を促進する可能性があります。

方法
2013年から2023年にかけて出版された3つの影響力のある精神医学ジャーナルから、介入のランダム化試験またはメタアナリシスを記述した研究の抄録を特定しました。スピンの存在または非存在は、スピンの有無に関する金標準の抄録を用いて検証された大規模言語モデル(GPT4-turbo)によって推定されました。

結果
分析対象となった合計663の抄録のうち、296(44.6%)が可能性のあるまたはおそらくスピンを示していました。これには、529件のランダム化試験のうち230件(43.5%)、134件のメタアナリシスのうち66件(49.3%)が含まれます。介入の種類別では、薬物治療310件中148件(47.7%)、心理療法238件中107件(45.0%)、その他の介入115件中41件(35.7%)がスピンを示していました。

結論と関連性
高影響力の精神医学ジャーナルにおける精神医療介入の抄録のかなりの割合が、潜在的に誤解を招く方法で結果を提示している可能性があります。大規模言語モデルを用いたスピン検出の成功は、将来の出版物でスピンを最小化するための識別と改訂を促進するかもしれません。

Research Letter: Characterizing spin in psychiatric clinical research literature using large language models
Perlis, R. H. 2024-07-01 http://medrxiv.org/cgi/content/short/2024.06.30.24309737v1

下記の文章は論文アブストラクトをもとに Retrieval-Augmented Language Modeling (RALM) により生成された文章であり、正確性は保証しません。

Question 27: 文脈として与えられた最新論文の内容を、背景、新規性、方法などに分けて、詳しく説明してください。

この論文では、臨床試験における患者募集の自動化に焦点を当てています。患者募集は臨床試験の成功にとって非常に重要であり、適格な患者を特定することが必要ですが、選択基準の複雑さと患者データの異質性が手動での分析を困難かつ時間を要する作業にしています。

【背景】
臨床試験では、適切な患者を効率的に特定し選択することが極めて重要です。しかし、選択基準が複雑であるため、これを手動で行うことは大きな負担となります。この問題を解決するために、患者データの自動解析と選抜を目指しています。

【新規性】
この研究の新規性は、シャムニューラルネットワーク(Siamese Neural Network)を基にしたモデル、Siamese-PTMの提案にあります。このモデルは、事前訓練されたLLaMA 2モデルを使用して、電子健康記録(EHR)と基準入力の文脈表現を導出し、二つの重み共有の同一サブネットワークを使用して共同でエンコードします。

【方法】
Siamese-PTMは、構造化されたEHRと非構造化EHRの両方で評価され、それぞれの予測情報性を単独および集合的な特徴セットとして分析します。さらに、シャムPTMのエンコーダーに対して様々な深層モデルを探求し、単一エンコーダーとの性能を比較します。基準ルールベースの分類器を開発し、それに比べてSiamese-PTMは性能を40%向上させました。

【結果と評価】
Siamese-PTMの学習した埋め込み空間の視覚化は、その予測の堅牢性を強化するものであり、モデルの有効性を示しています。このアプローチにより、臨床試験における患者募集プロセスの効率化と精度向上が期待されます。

Matching Patients to Clinical Trials using LLaMA 2 Embeddings and Siamese Neural Network
Chowdhury, S., Rajaganapathy, S., Yu, Y., Tao, C., Vassilaki, M., Zong, N. 2024-06-30 http://medrxiv.org/cgi/content/short/2024.06.28.24309677v1

下記の文章は論文アブストラクトをもとに Retrieval-Augmented Language Modeling (RALM) により生成された文章であり、正確性は保証しません。

Question 28: 文脈として与えられた最新論文の内容を、背景、新規性、方法などに分けて、詳しく説明してください。

背景:
この研究では、臨床実践における効果的なコミュニケーションの重要性が強調されています。コミュニケーションの失敗は、エラーや誤診、不適切な治療、そして不十分なケアにつながる可能性があります。また、コミュニケーションエラーは、重大事故の原因となり、医療システムの苦情の根本的な要因ともなっています。公式の臨床コミュニケーション(FCC)ツール、例えばISBARは、患者の結果を改善することが知られています。しかし、多くの非公式の臨床コミュニケーション(ICC)が電子医療記録(EMR)の外で行われており、その文書化は低品質であり、容易に監査されることはありません。

新規性:
2019年にAustin HealthがICCプロセスについて国家標準の臨床ガバナンス評価を行い、2020年にさらなる調査とプロセスマッピングが行われました。これにより、ICCの慣行を管理するための関連するポリシーと手順が不足していることが示されました。

方法:
この研究では、多職種のオンラインスタッフ横断調査をMicrosoft Formsを使用して実施しました。この調査は、使用されている非公式コミュニケーション方法の範囲を確認し、現在の多様なコミュニケーション技術とその固有のリスクに関する回答者の認識を特定することを目的としています。

結果:
115人の自己選択的な臨床および管理スタッフが調査に回答しました。複数のコミュニケーションチャネルが使用されていることが明らかになり、回答者は高いレベルのフラストレーション、遅延、中断、非効率を報告しました。望ましいコミュニケーションの改善と使用に関する考慮事項が特定されました。調査結果は、既存のICCフレームワークの臨床ガバナンス評価を検証し、技術改革の必要性を強調しました。

結論:
ICCのガバナンス基準には、地域レベルおよびより広いレベルでのギャップが存在します。技術プラットフォームへの連続的な追加が、高リスクのコミュニケーション環境を生み出しています。スタッフは、非効率、遅延、フラストレーション、および高い患者安全リスクのレベルを職業全体で一貫して報告しています。この作業は、非公式の臨床コミュニケーションに特化した企業プラットフォームの後続の開発に寄与しました。

Technology Based Challenges of Informal Clinical Communication in an Australian tertiary referral hospital : A mixed methods assessment of The Need for Change.
Hart, G. K., Hosking, N., Martin, L., Todd, J. 2024-06-28 http://medrxiv.org/cgi/content/short/2024.06.26.24308798v1

下記の文章は論文アブストラクトをもとに Retrieval-Augmented Language Modeling (RALM) により生成された文章であり、正確性は保証しません。

Question 29: 文脈として与えられた最新論文の内容を、背景、新規性、方法などに分けて、詳しく説明してください。

この論文は、バイオメディカルデータのエコシステムが歴史的に断片化されていた問題を解決するために、FAIR(Findable, Accessible, Interoperable, Reusable)データ原則の下での調和に向けて動いていることを背景にしています。この調和は、特に大規模で多様なデータセットに対して創造的で非標準的な計算分析パイプラインを実装することに興味を持つ様々なドメインの科学者にとって好機となっています。

新規性としては、クラウドベースの研究の機会が増える中で、特に計算能力が高くない研究者がカスタムクラウド分析を実行する際の困難を解決するためのアプローチを提案しています。具体的には、CAVATICAというクラウド計算プラットフォームで使用可能なアクセスしやすく、シンプルな方法を提供しています。

方法としては、全ゲノム配列を用いて親子三人組のケーススタディから性特異的遺伝的影響を検出するためのカスタムワークフローをクラウド上で開発しました。これには複数のプログラミング言語とカスタムソフトウェアパッケージが必要でした。このアプローチには3つのコンポーネントが含まれています:ソフトウェア環境をコンテナ化するためのDocker、各分析ステップのためのツール作成、そしてツールをCommon Workflow Language(CWL)パイプラインに織り交ぜるための視覚的ワークフローエディタです。

この方法は、基本的な計算スキルを持つ任意の研究者がアクセス可能であり、クラウドでの任意のスケーラブルな高スループットバイオメディカルデータ分析を実装するために容易に拡張可能です。また、BioData Catalystなど他の一般的に使用される計算プラットフォームにも適用可能です。

このアプローチは、データの多用途再利用を促進し、FAIRデータの時代において加速されたバイオメディカル発見を促進すると信じています。

Custom Biomedical FAIR Data Analysis in the Cloud Using CAVATICA
Berke, S. R., Kanchan, K., Marazita, M. L., Tobin, E., Ruczinski, I. 2024-06-28 http://medrxiv.org/cgi/content/short/2024.06.27.24309340v1

下記の文章は論文アブストラクトをもとに Retrieval-Augmented Language Modeling (RALM) により生成された文章であり、正確性は保証しません。

Question 30: 文脈として与えられた最新論文の内容を、背景、新規性、方法などに分けて、詳しく説明してください。

この研究は、AIの急速な発展とその規制フレームワークの遅れに焦点を当てています。特に、AIモデルの適応性が規制当局に独特の課題を提起していることが指摘されています。モデルの更新がパフォーマンス向上に寄与する一方で、安全リスクも導入する可能性があるためです。この研究では、FDA(米国食品医薬品局)によって承認されたAI医療機器の更新頻度と性質を体系的に分析しています。

背景として、AI技術の急速な進展とそれに伴う規制の遅れ、特に医療分野でのAI機器の安全性と効果性に対する懸念が挙げられます。FDAはAI医療機器の規制と承認において先駆者とされ、数百のAI医療機器を承認しています。

新規性としては、FDA承認済みのAI医療機器の更新頻度とその性質に関する体系的な分析を行っている点が挙げられます。分析の結果、全デバイスの2%未満が新しいデータに基づいて再トレーニングされて更新されたことが報告されており、約四分の一のデバイスが新機能やマーケティングの主張の形で更新されていることが明らかになりました。

方法としては、FDAのウェブサイトを通じて公開されている主要データを使用し、補足資料で使用されたデータとコードの分析を行い、GitHubで公開予定です。症例研究として、肺胸膜症検出モデルを分析し、モデルのパフォーマンスが新しいサイトで評価された際に最大0.18 AUCまで低下するが、サイト固有のデータで再トレーニングすることでこのパフォーマンスの低下を軽減し、最大0.23 AUCまで回復することが確認されました。

この研究は、FDA承認済みのAIデバイスの更新状況についての詳細な洞察を提供し、モデル更新と適応AIに向けた将来の規制ポリシーに対する洞察を提供しています。

Regulating AI Adaptation: An Analysis of AI Medical Device Updates
Wu, K., Wu, E., Rodolfa, K., Ho, D. E., Zou, J. 2024-06-28 http://medrxiv.org/cgi/content/short/2024.06.26.24309506v1


この記事が気に入ったらサポートをしてみませんか?