RAG（検索拡張生成）包括的な論文をわかりやすく解説

2023年12月24日 13:47

【新サイトオープンのお知らせ📢】

いつもnoteをご覧いただき、ありがとうございます。
この度、AIに特化した総合情報サイト「AI総合研究所」をオープンしました！🎉

「AI総合研究所」では、以下のような特徴や価値を提供していきます💡
　✅AIの基礎知識から最新トレンドまで、幅広い情報を分かりやすく解説　
　✅企業のAI活用事例を詳細に分析し、実践的なノウハウを提供
　✅AIツールやサービスの比較・解説記事で、読者のツール選定をサポート
　✅AIの倫理的課題や社会的影響についても深く掘り下げて議論
　✅AI導入に関する課題や対策を専門家の視点から分析し、解決策を提案

AIに関する最新ニュースや導入事例、サービス、お役立ち情報などのコンテンツも提供しています📝✨

さらに無料でDLできるサービス紹介資料を提供しているほか、AI導入に関する相談窓口も設けられています。
専門家によるアドバイスで、AIの導入をサポートします🤝

noteと合わせて、ぜひ「AI総合研究所」もチェックしていただけると嬉しいです。👉AI総合研究所はこちらから

はじめに

本論文では、Retrieval-Augmented Generation（RAG）というAIの精度を高める技術について徹底的に解説しています。
この１年で急速に進化した手法の最新論文の概要をまとめました。この機会に５分の間、時間を割いて読んでみてください。

RAGとは

RAGは、情報検索部分と回答生成部分から構成されています。Retrieverは入力に関連する情報をKnowledge DBから取得し（Retriever；検索）、それをもとにGeneratorが回答を生成します（Generator；拡張）。この時Generatorはプロンプトという指示文が与えられており、それに沿った生成を行います。

R A Gの研究のタイムラインは以下の通り。2023年以降大きく発展したことがわかります。

RAGの定義やメリットデメリット

RAGの具体的な定義は、質問に答えたり、テキストを生成したりする際に、まず膨大な文書コーパスから関連する情報を検索するモデルを指します。

メリット

ファインチューニングをしなくて済み、知識を追加できることです。R A Gは質問に基づき関連文書を検索するフェイズと生成フェイズの大きく２つにわけることができます。

R A Gのメリット：
-検索技術を使用することで最新の情報を取り込める
-適時性と正確性の維持
-RAGのカスタマイズ性（コーパスをインデックス化することで異なるドメインに適応可能）
-データのセキュリティコントロール
-データの拡張性；トレーニングセットが必要なく効率的
-ハルシネーションがなく引用元が明確

Finetuningが適している場合：
-広範なドメインの理解
-新しい言語の学習
-形式やスタイルの学習

相互作用はより効果的である。これらは排他的であり、相互補完であることを示している。

RAGの発展と特徴について

、Naive RAG（初期）、Advanced RAG（Naïve R A Gの欠点でもあった索引付け補完）、Modular RAG（機能モジュールを拡張する手法の統合）：モジュールの種類や各種類の比較は図を参照。

RAGのコア・コンポーネントの分類：

Retriverの最適化には：
-チャンクの最適化　コーパスの文書に最適なチャンクサイズを見つけることが重要
- Embeddingのファインチューニング（ドメイン知識）

R A Gの評価について：RAGAS、ARESの手法（特に解答の忠実性、文脈との関連性、回答との関連性を見た新しめの手法）

R A Gの課題：

垂直方向の最適化

: RAG技術は急速に進歩していますが、まだいくつかの課題があります。特に長いコンテキストの扱い、RAGの堅牢性（不適切な情報の取得や事実と矛盾する情報の影響）、RAGとファインチューニングの協調、そして企業のエンジニアリングニーズに対応する実践的な問題などが挙げられます。

水平方向の拡張

: RAGのアプローチは様々な分野に広がっています。画像、コード、構造化された知識、音声、ビデオなどのモーダルデータに対する応用が進んでいます。

今後の研究では、RAGモデルの適応性と普遍性を探求することが重要です。これには、医学、法律、教育などの専門分野での応用が含まれます。

AI総研では生成AIに関する情報をわかりやすく発信していきます。AIが皆様のより身近になれば幸いです！

原著論文はこちらに：

この記事が気に入ったらサポートをしてみませんか？