【AI面试临阵磨枪-84】如何看待 RAG vs 微调(Fine-tuning)?选型依据

一、面试题

面试官:RAG 和微调 Fine‑tuning 怎么选?各自优缺点、选型依据、适用场景

二、满分精简回答(直接背诵)

1. 核心区别一句话

  • RAG:外挂知识库,实时查询,不改动模型权重
  • 微调:把知识/风格/规则注入模型权重,永久固化

2. RAG 优缺点

优点

  1. 知识实时可更新,新增文档立刻生效,不用重训
  2. 不改变模型本身能力,风险低、幻觉可控
  3. 支持海量外部知识,不受上下文限制
  4. 成本低、速度快、可解释,适合企业私有数据

缺点

  1. 依赖检索质量,检索差回答就差
  2. 长上下文、复杂推理场景表现弱
  3. 实时数据、强业务规则场景适配一般

3. 微调 Fine‑tuning 优缺点

优点

  1. 知识内化到模型,推理更自然、响应更快
  2. 适合固定风格、话术、格式、业务范式、行业术语
  3. 复杂长链路推理、指令遵循更强

缺点

  1. 更新难:数据变了必须重新微调
  2. 成本高、算力要求大、周期长
  3. 容易灾难性遗忘、过拟合
  4. 隐私数据风险高、不可控

4. 选型黄金标准(面试必背)

选 RAG 的场景

  1. 知识经常变动(政策、库存、订单、实时规则)
  2. 数据量大、文档多、需要随时新增
  3. 需要可解释、可溯源、合规审计
  4. 私有敏感数据,不想改动模型

选微调的场景

  1. 固定话术、语气、格式、输出规范(客服口吻、公文格式)
  2. 行业术语、专有名词、固定业务逻辑需要内化
  3. 推理链路长、复杂指令遵循、多步骤任务
  4. 知识库稳定、极少变更

最优生产方案:RAG + 微调结合

  • 微调:固定角色、语气、格式、指令、行业术语
  • RAG:提供实时、动态、可变知识
    取长补短,工业界 90% 都是这么做。

三、一句话总结(30秒口述)

动态知识用RAG,固定范式用微调;简单检索用RAG,复杂推理用微调;生产环境RAG+微调组合使用。

四、极简对比表(速记)

|------|-----|-------|
| 维度 | RAG | 微调 |
| 知识更新 | 实时 | 需重训 |
| 成本 | 低 | 高 |
| 幻觉 | 可控 | 易固化错误 |
| 推理能力 | 一般 | 更强 |
| 合规溯源 | 强 | 弱 |

相关推荐
IT_陈寒2 小时前
JavaScript的闭包把我坑惨了,说好的内存会自动回收呢?
前端·人工智能·后端
jooloo6 小时前
Codex 间歇性 400 之谜:一条对话里,它为什么有时候用 chat/completions,有时候切到 responses?
人工智能
JustHappy6 小时前
我汇总了身边朋友的经历才发现,其实第一份实习是最难找的......
前端·后端·面试
uhakadotcom6 小时前
在python 的 工程化架构中 ,什么是 薄包装器层?
后端·面试·github
用户5191495848456 小时前
OpenSSL PKCS#12 PBMAC1 堆栈缓冲区溢出漏洞 (CVE-2025-11187) 分析与验证
人工智能·aigc
用户5191495848457 小时前
HP Sound Research SECOMNService 权限提升漏洞利用工具
人工智能·aigc
用户018349301698 小时前
给 AI 智能体能力包一层 BFF,前端只调一个接口
人工智能
假如让我当三天老蒯11 小时前
模块化:ES Module 与 CommonJS 的区别
前端·面试
沉默王二11 小时前
面试官:RAG 不用向量数据库,用 MySQL 硬扛?我:100 万向量不是很轻松?
mysql·面试·ai编程