问答样例在 RAG 系统中,核心是通过 提示词(Prompt) 引导模型,让它学会如何正确使用检索到的上下文资料 来回答问题,从而大幅提升答案的准确性、格式规范性和风格一致性。
一、核心作用
- 规范回答格式:明确告诉模型答案应包含哪些要素(如引用、步骤、列表)。
- 约束行为边界 :教会模型"资料不足时必须说不知道",杜绝幻觉。
- 统一风格口吻:确保输出符合专业、简洁、口语化等要求。
- 强化引用逻辑 :示范"只基于上下文回答,不编造信息"。
二、标准使用方法
标准模板结构(在检索到上下文后,拼接示例):
【系统指令】
你是专业问答助手,必须严格依据提供的上下文回答,**禁止编造信息**。
上下文不足时,明确回复:"根据现有资料,无法回答该问题。"
【示例1(信息充足)】
问题:RAG的全称是什么?
上下文:RAG 是 Retrieval-Augmented Generation 的缩写,即检索增强生成。
回答:RAG 的全称是 Retrieval-Augmented Generation(检索增强生成)。
【示例2(信息不足)】
问题:RAG是谁发明的?
上下文:RAG 是 Retrieval-Augmented Generation 的缩写,即检索增强生成。
回答:根据现有资料,无法回答该问题。
---
【当前任务】
问题:{用户问题}
上下文:{检索到的知识库内容}
回答:
三、进阶用法:FAQ 问答对直接入库
如果已有大量历史 Q&A 问答对(如客服、产品手册),可直接作为 RAG 知识库:
- 不切割 :将完整问答对作为最小单元(
chunk_size=完整问答)。 - 双索引 :
- 对 问题 向量化,用于相似度检索。
- 对 答案 建立关键词索引(BM25),辅助召回。
- 检索策略 :
- 用户问题 → 匹配相似历史问题 → 取出对应答案。
- 高相似度(>0.85):直接返回标准答案。
- 中相似度(0.6--0.85):以答案为上下文,让模型润色。
- 低相似度(<0.6):拒绝回答或引导人工。
优势:
- 检索更快、更准(问题匹配问题)。
- 答案稳定可控,适合标准化场景(售后、政务)。
四、关键注意事项
- 数量控制 :示例 2--3 个最佳,太多占用上下文窗口。
- 质量优先 :
- 覆盖:信息充足、信息不足、边界场景。
- 示例必须正确、格式规范、风格统一。
- 位置 :示例放在 系统指令后、用户问题前。
- 分隔清晰 :用
---或###分隔示例与当前任务。
五、效果对比
- 无示例 : 问:RAG 优缺点?
答:RAG 很好用,能提高准确性,还能降低成本。(可能幻觉)
- 有示例 : 问:RAG 优缺点?
上下文:RAG 优点是提升准确性、减少幻觉;缺点是增加检索耗时、工程复杂。
答:RAG 优点为提升回答准确性、减少幻觉;缺点是增加检索耗时、工程复杂度较高。
总结
问答样例是 RAG 系统的 "行为规范":
- 基础场景 :在 Prompt 里加 2--3 个 Few-Shot 示例,教会模型"怎么答、答什么、不答什么"。
- FAQ 场景 :直接把 问答对入库,做"问题匹配问题"的精准检索。