← 返回首页
🧠

Self RAG

📂 llm ⏱ 1 min 82 words

Self RAG概述

Self RAG是一种让LLM自主决定何时需要检索、检索什么内容、以及如何使用检索结果的自适应RAG方法。与传统RAG始终执行检索不同,Self RAG能够根据查询的实际需求动态调整检索行为。

核心机制

反思标记

Self RAG在生成过程中使用特殊标记:

工作流程

  1. 检索决策:模型判断是否需要检索
  2. 检索执行:如需要则执行检索
  3. 相关性判断:评估检索结果的相关性
  4. 生成与验证:生成内容并验证与检索的一致性
  5. 质量评估:评估最终输出的有用性

与传统RAG的对比

特性 传统RAG Self RAG
检索时机 始终检索 自适应检索
检索内容 固定策略 自主选择
结果利用 直接使用 验证后使用
效率 可能浪费 按需检索

训练方法

监督微调

使用包含反思标记的训练数据:

奖励模型

训练评估各步骤质量的奖励模型:

优势

  1. 效率提升:不必要的检索被跳过
  2. 质量保障:生成内容经过验证
  3. 减少幻觉:基于证据生成
  4. 灵活性:适应不同查询类型

局限性

变体与发展

CRAG(Corrective RAG)

增强检索结果的纠正能力,对低质量检索进行退化搜索。

Adaptive RAG

根据查询复杂度选择不同RAG策略:

Streaming RAG

支持流式输出的RAG方案。

应用价值

Self RAG代表了RAG技术从被动检索向主动检索的转变。它使LLM能够更智能地利用外部知识,提升回答质量的同时减少不必要的计算开销,是RAG技术发展的重要方向。