Day6:微调 vs RAG 场景区分(面试高频)

Day5:微调 vs RAG 场景区分(面试高频)

一、先明确两个核心概念

1. 微调(Fine-tuning)

就是我们前面学的 SFT / LoRA,核心逻辑是:

  • 标注数据训练模型参数,把知识 / 风格 "刻进模型里"
  • 训练后模型自带该能力,不用每次额外输入

2. RAG(Retrieval-Augmented Generation,检索增强生成)

核心逻辑是:

  • 不改动模型本身,额外加一个 "知识库检索" 环节
  • 提问时先从外部知识库检索相关内容,再把检索结果 + 问题一起喂给模型,让模型基于检索到的信息回答

二、核心区别对比(面试必背表格)

表格

对比维度 微调(Fine-tuning) RAG(检索增强生成)
核心逻辑 训练模型参数,让模型 "学会" 不改动模型,给模型 "查资料"
数据依赖 需要高质量标注数据 只需要结构化 / 非结构化知识库,无需标注
硬件成本 高,需要显卡算力 低,普通服务器就能跑
更新成本 高,数据 / 业务变更后要重新训练 低,直接更新知识库即可
知识准确性 依赖训练数据,过时知识会误导 依赖检索结果,信息可实时更新
长上下文支持 受模型上下文窗口限制 可通过分块 + 检索突破窗口限制
典型场景 固定话术、风格对齐、轻量领域知识 实时信息查询、大知识库问答、需要溯源

三、通俗场景类比(超好懂)

  • 微调:就像给学生上课,把知识点教进他脑子里,之后他遇到相关问题就能直接答。
  • RAG:就像开卷考试,学生本身不变,做题时给他一本参考资料,他照着资料回答。

四、面试高频场景题:该选微调还是 RAG?

✅ 优先选 微调 的场景

  1. 对话风格、语气、固定话术统一(比如客服固定回复模板)
  2. 轻量、稳定的领域知识(如固定产品参数、企业内部流程)
  3. 数据量不大、长期稳定不变的业务
  4. 需要模型 "天生自带" 某种能力,不想每次都检索

✅ 优先选 RAG 的场景

  1. 知识需要频繁更新(如实时新闻、政策、最新数据)
  2. 知识库体量很大(如企业百万级文档、行业百科)
  3. 需要回答可溯源(用户要求看到引用的原文出处)
  4. 数据质量参差不齐,无法做高质量标注

五、组合使用(工业界主流方案)

实际项目中,两者常结合使用:

  • 微调统一模型的输出风格、格式、话术
  • RAG补充最新、最详细的业务知识
  • 最终实现:风格统一 + 内容准确 + 信息可溯源
相关推荐
英俊潇洒美少年1 小时前
Vue2 $set 深度解析 + 批量更新全套优化方案(原理+实战+踩坑+面试)
面试·职场和发展·wps
Xzh04231 小时前
Redis黑马点评 实战复盘与面试高频考点详解
java·数据库·redis·面试
SiYuanFeng2 小时前
百度网盘【搜索/查找】如何限定在当前文件夹下搜索
面试
Ws_3 小时前
C# 桌面端开发工程师面试题 + 参考答案
开发语言·面试·c#
黄啊码3 小时前
【黄啊码】拉勾倒了,但你的简历早就不该在招聘软件上了
人工智能·面试
Aphasia3113 小时前
Vite配置代理和后端服务器CORS
面试
触底反弹3 小时前
dom操作这篇文章就够了
javascript·面试
AI人工智能+电脑小能手3 小时前
【大白话说Java面试题 第86题】【Mysql篇】第16题:MySQL 中锁的种类与行锁实现原理?
java·开发语言·数据库·mysql·面试
我爱cope3 小时前
【Agent智能体14 | 工具使用-如何创建工具】
人工智能·语言模型·职场和发展