見出し画像

LASIGE and UNICAGE solution to the NASA LitCoin NLP Competition

1. 本研究の学術的背景,研究課題の核心をなす学術的「問い」は?
- 医学的自然言語処理(NLP)は、処理するテキストの量や異質性が原因で多くの研究者にとって煩雑なものとなっている。この課題に対処するため、業界は高効率なツールの開発とより柔軟なエンジニアリングソリューションの作成に取り組んでいる。本研究では、LasigeUnicage_NERとBiOntという学術システムを、業界で提供されるデータエンジニアリングソリューションと統合し、形式的知識である外部知識を追加したモデル(データベースなど)を練習することによって、外部情報を含めた高水準の情報抽出を実現するための取り組みである。

2. 本研究の目的及び学術的独自性と創造性は?
- 本研究の目的は、医学的自然言語処理における業界と学術界の連携を実現することにある。本研究は、高度な外部知識の自動抽出を実現し、自然言語処理の精度を向上させることができる。本研究の独自性と創造性は、業界で開発されたデータエンジニアリングソリューションと学術システムの統合により、効率的な情報抽出を実現することである。

3. 本研究の着想に至った経緯や,関連する国内外の研究動向と本研究の位置づけは?
- 医学的自然言語処理に関連して、学術界と業界の連携が進んでいる。学術界は、自然言語処理の研究を行い、業界はそれを実践に落とし込む。本研究は、LasigeUnicage\_NER とBiOntという学術システムを組み合わせることで、業界で提供されるデータエンジニアリングソリューションを利用し、自己学習と外部知識の利用によって、情報抽出の高度化を図った。

4. 本研究で何をどのように,どこまで明らかにした?
- 本研究では、学術的な名前対応抽出(LasigeUnicage\_NER)と関係抽出(BiOnt)のために業界で提供されるデータエンジニアリングソリューションを使用して、医療文書の自然言語処理を改良することを提案した。ビジネスとアカデミアのコラボレーションにより、高度な外部知識の自動抽出の実現を通じて、NLPの性能を向上した。

5. 本研究の有効性はどのように検証した?
- 本研究の有効性は、2022年のLitCoin NLP Challengeで、約200チームが参加した中で第7位に入賞したことで検証された。LasigeUnicageは、学術界(LASIGE)と業界(Unicage)の協力を実現し、NLPの分野における取り組みを推進した。また、本研究に関するソフトウェアは出版されており、これを検証することもできる。

この記事が気に入ったらサポートをしてみませんか?