Cervical cancer survival prediction by machine learning algorithms: a systematic review

子宮頸がんは、女性の生殖器系に発生する一般的な悪性腫瘍であり、世界中の女性の死亡原因の上位を占めると考えられている。あらゆる臨床研究において極めて重要なイベントまでの時間の分析は、生存予測の手法で十分に行うことができる。本研究では、子宮頸がん患者の生存予測に機械学習を用いることを系統的に検討することを目的とする。

方法

2022年10月1日にPubMed、Scopus、Web of Scienceの各データベースの電子検索を行った。データベースから抽出されたすべての論文はExcelファイルに集められ、重複する論文は削除された。論文はタイトルと抄録に基づいて2回スクリーニングし、包含基準と除外基準で再度チェックした。主な包含基準は、子宮頸がんの生存を予測するための機械学習アルゴリズムであった。論文から抽出された情報は、著者、出版年、データセットの詳細、生存タイプ、評価基準、機械学習モデル、アルゴリズムの実行方法などであった。

結果

本研究では、合計13本の論文が対象となり、そのほとんどが2018年以降に発表されたものであった。最も一般的な機械学習モデルは、ランダムフォレスト(6論文、46%)、ロジスティック回帰(4論文、30%)、サポートベクターマシン(3論文、23%)、アンサンブルおよびハイブリッド学習(3論文、23%)、Deep Learning(3論文、23%)でした。本研究のサンプルデータセット数は85~14946患者の間で変動し、2つの論文を除いてモデルは内部検証された。全生存期間(0.40~0.99)、無病生存期間(0.56~0.88)、無増悪生存期間(0.67~0.81)の曲線下面積(AUC)範囲はそれぞれ(最低から最高)受信。最終的に、子宮頸がんの生存率の予測に有効な役割を持つ15個の変数が特定された。

結論

異質な多次元データを機械学習技術で組み合わせることで、子宮頸がんの生存率を予測する上で非常に影響力のある役割を果たすことができます。機械学習の利点にもかかわらず、解釈可能性、説明可能性、不均衡なデータセットという問題は、依然として最大の課題の1つである。生存予測のための機械学習アルゴリズムを標準として提供するためには、さらなる研究が必要である。

この記事が気に入ったらサポートをしてみませんか?