T-RAG = RAG + ファインチューニング + エンティティ検出

2024年6月15日 02:41

本記事については生成AIを活用して生成された記事となります。
解説内容の正確性については読者ご自身でご確認いただきますようお願いいたします。

T-RAGアプローチは、RAG（Retrieval Augmented Generation）アーキテクチャとファインチューニングされたオープンソースのLLM（大規模言語モデル）およびエンティティツリーベクトルデータベースを組み合わせたものです。この手法は、文脈的な検索に焦点を当てています。

T-RAGの基本概念

T-RAGは、企業の機密文書に対する質問応答のために設計されており、データセキュリティと堅牢性が重要です。これには、公開APIの代わりにオンプレミスでデプロイ可能なオープンソースモデルを使用する必要があります。

T-RAGの特徴の一つは、ベクトルデータベースに加えてエンティティツリーを利用して文脈を検索することです。エンティティツリーは、組織内のエンティティとその階層構造に関する情報を格納します。

研究者たちは、生成された応答の質を評価するための新しい指標「Correct-Verbose」を導入しました。これは、応答の正確さだけでなく、元の質問の範囲を超えた追加の関連情報の有無も評価します。

ユーザーのクエリに対して、ベクトルデータベースから関連する文書チャンクを検索し、これをLLMの文脈参照として使用します。組織関連のエンティティがクエリに含まれている場合、エンティティツリーから情報を抽出し、文脈に追加します。

spaCyライブラリを使用して、組織内の名前付きエンティティを識別し、関連情報を抽出して文脈に組み込みます。

この研究は、RAGとファインチューニングを組み合わせたアプローチが、データプライバシー、推論レイテンシ、トークン使用コスト、地域および地理的な可用性の問題を解決する方法を示しています。また、実際のLLMアプリケーションの構築経験に基づいた洞察を提供しています。