Descriptive Knowledge Graph in Biomedical Domain
本研究の学術的背景、研究課題の核心をなす学術的「問い」は、最新の文献コーパスから知識を効率的に抽出する方法は存在するか、またそれは研究者が追いつくために重要なのか、という点です。
本研究の目的は、バイオ医療コーパスから情報を抽出し、関連する知識を見つけやすくするシステムを開発することです。そのための手法として、従来の検索エンジンや探索システムとは異なり、関連したバイオメディカルのエンティティ(例:特定の病気への効果がある化学物質)や間接的に関連するエンティティ(例:病気の治療に使える潜在的な薬物)を探索可能な関係グラフとして整理することです。また、ChatGPTと関係統合モデルを使用して、検索された情報から簡潔かつ信頼性の高い説明文を生成し、研究者の大量の読書作業を減らすことも目的としています。
本研究の着想は、COVID-19のような新しい疾患が発生すると、関連する研究が短期間で数千件も出版されるため、研究者が最新の知見を把握する必要性が明らかになったことからきました。しかし、最新の知見を調査するためには膨大な努力が必要であり、研究者は全体像を見失うことがあり、重複した作業をして治療法の開発が遅れることもあります。このような課題を解決するために、最新の文献コーパスから包括的な情報を効果的に取得できる探索システムが重要であると位置づけています。
本研究では、バイオメディカルのコーパスを利用して、有用な情報を抽出し、関連するエンティティ間の関係を説明するための知識グラフを構築しました。具体的には、コーパスからエンティティを抽出し、適切な関連文とともに知識グラフを構築しました。また、ChatGPTと関係統合モデルを使用して、検索された情報に基づいてエンティティの間の簡潔な関係を説明することで、読者の努力を軽減しました。
本研究の有効性は、COVID-19研究における応用例を通じて検証されました。具体的には、薬物再利用や文献の整理といった分野での有用性が示されました。また、ユーザーが簡潔な関係説明文を生成して読むことで、情報の把握が容易になり、興味のある情報に対して対話的に探索することも可能になりました。