見出し画像

Transformers for extracting breast cancer information from Spanish clinical narratives

https://www.sciencedirect.com/science/article/pii/S0933365723001392

1. 本研究の学術的背景,研究課題の核心をなす学術的「問い」は何ですか?
- 電子カルテの広く普及した利用は、臨床研究の重要な情報源として大きな可能性を秘めています。しかし、過去の研究では、スペイン語の癌領域で情報抽出をサポートするために、医療用語の限られたセットのみを抽出することに重点を置いていました。本研究では、深層学習を用いたアプローチを提案し、スペイン語で書かれた乳がんの臨床ノートから固有名詞を抽出するtransformer-based手法を比較検討しています。

2. 本研究の目的及び学術的独自性と創造性は何ですか?
- 本研究では、スペイン語の乳がん臨床ノートから情報抽出のために、深層学習を用いたtransformer-based手法の採用を提案し、いくつかの言語モデルを比較しています。さらに、乳がん概念の注釈に関する体系を提案し、乳がんに関するコーパスを開発しています。本研究では、語彙学的特徴の計算に時間がかかるという問題を避けることができる、学習済みの言語モデルを微調整することで情報抽出を自動化する転移学習の手法が提案されており、先駆的な研究です。

3. 本研究の着想に至った経緯や,関連する国内外の研究動向と本研究の位置づけは何ですか?
- 過去に、スペイン語の癌領域における情報抽出に関する研究がいくつか報告されていますが、乳がん領域の情報抽出については、ほとんど研究報告がなかったため、本研究は乳がん領域における情報抽出の先駆的な研究と考えられます。

4. 本研究で何をどのように、どこまで明らかにした?
- 本研究では、乳がん領域における情報抽出を支援するため、transformer-based手法を提案し、異なる言語モデルの性能を比較しました。また、乳がん概念の注釈付けに用いるスキーマを提案し、臨床ノートに関する乳がんコーパスを作成しました。乳がんに関する学習済みの言語モデルを用いたところ、RoBERTa BiomedicalはFスコア95.01%、RoBERTa BNEはFスコア94.54%を得ることができました。これらの結果から、transformersは、スペイン語のクリニカル領域における情報抽出において有用であることが示され、標準的ではない概念の面での情報抽出にも対応できることが明らかになりました。

5. 本研究の有効性はどのように検証した?
- 本研究では、異なる言語モデルの性能を比較し、RoBERTa Biomedicalで最高のFスコアを達成しました。本研究で提案された乳がんコーパスは、臨床医によって手動で注釈が付けられ、より高度な医療用語に対応できることが明らかになっています。

この記事が気に入ったらサポートをしてみませんか?