Beyond Text: A Deep Dive into Large Language Models' Ability on Understanding Graph Data

Ikemen Mas Kot

2023年10月16日 17:13

本研究の学術的背景は、自然言語処理（NLP）タスクにおける大規模な言語モデル（Large Language Models、LLMs）の成功です。その一方で、グラフ構造データ上でのLLMsの能力はまだ探求されていない状態です。本研究の核心となる問いは、「LLMsの強みを拡げて、グラフ構造データにおいても予測能力を発揮できるか、そしてグラフデータ専用の最先端モデル（例えばグラフニューラルネットワーク）と競合できるか」です。
本研究の目的は、LLMsがグラフ構造データの分野での可能性を評価することで、その強みと限界を理解することです。独自性と創造性は、様々なプロンプト形式やタスク／データセットの選択を通じて、LLMsがグラフ構造をどのように解釈して活用できるかを分析することにあります。
本研究の着想は、LLMsがグラフ構造データを扱う能力がまだ不明確であるという問題から生まれました。関連する研究動向としては、最近の大規模な言語モデル（例えばTransformers、BERT、GPT）が自然言語処理タスクで優れた成果を上げています。しかし、それらの成功がほとんどNLPの連続データタスクに限定されており、グラフ構造データの扱いにはまだ課題があります。
本研究では、ノードレベル、エッジレベル、グラフレベルの予測を含む様々なグラフベースのタスクで大規模言語モデルの能力を包括的に調査し、その結果をグラフ専用のモデルと比較することで、LLMsの強みと限界を明確にしました。
本研究の有効性は、多角的な実験により検証されました。特に、異なるプロンプト形式の変更やタスク／データセットの選択により、LLMsがグラフの構造情報をどの程度効果的に抽出・活用できるかを評価しました。さらに、引用ネットワーク、ソーシャルネットワーク、化学ネットワークといった様々なデータセットのドメインを適用して検証しました。

この記事が気に入ったらサポートをしてみませんか？