一、面试题
面试官:RAG 和微调 Fine‑tuning 怎么选?各自优缺点、选型依据、适用场景。
二、满分精简回答(直接背诵)
1. 核心区别一句话
- RAG:外挂知识库,实时查询,不改动模型权重
- 微调:把知识/风格/规则注入模型权重,永久固化
2. RAG 优缺点
优点
- 知识实时可更新,新增文档立刻生效,不用重训
- 不改变模型本身能力,风险低、幻觉可控
- 支持海量外部知识,不受上下文限制
- 成本低、速度快、可解释,适合企业私有数据
缺点
- 依赖检索质量,检索差回答就差
- 长上下文、复杂推理场景表现弱
- 实时数据、强业务规则场景适配一般
3. 微调 Fine‑tuning 优缺点
优点
- 知识内化到模型,推理更自然、响应更快
- 适合固定风格、话术、格式、业务范式、行业术语
- 复杂长链路推理、指令遵循更强
缺点
- 更新难:数据变了必须重新微调
- 成本高、算力要求大、周期长
- 容易灾难性遗忘、过拟合
- 隐私数据风险高、不可控
4. 选型黄金标准(面试必背)
选 RAG 的场景
- 知识经常变动(政策、库存、订单、实时规则)
- 数据量大、文档多、需要随时新增
- 需要可解释、可溯源、合规审计
- 私有敏感数据,不想改动模型
选微调的场景
- 固定话术、语气、格式、输出规范(客服口吻、公文格式)
- 行业术语、专有名词、固定业务逻辑需要内化
- 推理链路长、复杂指令遵循、多步骤任务
- 知识库稳定、极少变更
最优生产方案:RAG + 微调结合
- 微调:固定角色、语气、格式、指令、行业术语
- RAG:提供实时、动态、可变知识
取长补短,工业界 90% 都是这么做。
三、一句话总结(30秒口述)
动态知识用RAG,固定范式用微调;简单检索用RAG,复杂推理用微调;生产环境RAG+微调组合使用。
四、极简对比表(速记)
|------|-----|-------|
| 维度 | RAG | 微调 |
| 知识更新 | 实时 | 需重训 |
| 成本 | 低 | 高 |
| 幻觉 | 可控 | 易固化错误 |
| 推理能力 | 一般 | 更强 |
| 合规溯源 | 强 | 弱 |