← 返回首页
🧠

文档问答

📂 llm ⏱ 1 min 90 words

文档问答概述

文档问答(Document QA)是指基于给定文档回答用户问题的任务。用户上传或指定文档后,系统能够理解文档内容并准确回答相关问题。这是LLM最实用的应用场景之一。

系统架构

RAG架构

最常见的文档问答实现方式:

  1. 文档处理:解析、分块、索引
  2. 检索:根据问题检索相关段落
  3. 生成:基于检索结果生成答案
  4. 引用:标注答案来源

长上下文架构

利用大上下文窗口:

文档处理流程

文档解析

支持多种格式:

文档分块

将长文档切分为适当大小的块:

元数据提取

保留文档结构信息:

检索策略

向量检索

关键词检索

混合检索

结合向量和关键词检索:

生成增强

提示工程

设计适合文档问答的提示:

多文档综合

跨文档综合信息:

引用标注

在答案中标注来源:

应用场景

质量评估

优化方向

  1. 提升文档解析的准确性
  2. 优化分块策略提升检索质量
  3. 增强跨文档推理能力
  4. 支持更多文档格式
  5. 提升复杂表格和图表的理解

文档问答是LLM落地最广泛的应用之一,持续优化各环节质量是提升用户体验的关键。