【大模型】大模型项目选择 RAGvs微调?

RAG

输入问题,在知识库匹配知识,构建提示词:基于{知识}回答{问题}

微调

用知识问答对重新训练大模型权重,输入问题到调整后的大模型

如何选择

如果业务要求较高,RAG和微调可以一起使用

1-动态数据

复制代码
选择RAG
原因:RAG将数据存放到数据库即可,微调需要重新训练模型,微调成本大

2-模型能力定制

复制代码
选择微调
原因:用户想要回答有特殊口吻/专业内容等,如猫娘大模型/阅读研报/文本抽取内容,微调可以定制回答

3-幻觉

复制代码
选择RAG
原因:带有上下文知识的输入会减少模型幻觉的产生

4-可解释性

复制代码
选择RAG
原因:RAG可以给用户输出知识库数据供参考,提高回答可信度

5-成本

复制代码
选择RAG
原因:RAG只需要构建出知识图谱/知识数据库即可,而微调需要考虑数据集质量以及不断训练模型,微调成本高

6-依赖大模型通用能力

复制代码
选择RAG
原因:微调会改变大模型的权重,提高模型专业能力,但会降低模型通用能力(模型遗忘)

7-延迟

复制代码
选择微调
原因:RAG会有如知识库检索、排序、匹配等操作,会耗时

8-智能设备

复制代码
选择微调
原因:移动端小模型,业务场景需要突出专业能力
相关推荐
Tadas-Gao1 天前
Mem0分层记忆系统:大语言模型长期记忆的架构革命与实现范式
人工智能·语言模型·自然语言处理·架构·大模型·llm·transformer
山顶夕景1 天前
【VLM】HopChain视觉语言推理多跳数据合成框架
大模型·llm·cot·vlm·视觉模型
千桐科技1 天前
大模型幻觉难解?2026深度解析:知识图谱如何成为LLM落地的“刚需”与高薪新赛道
人工智能·大模型·llm·知识图谱·大模型幻觉·qknow·行业深度ai应用
CoderJia程序员甲1 天前
GitHub 热榜项目 - 日榜(2026-03-22)
人工智能·ai·大模型·github·ai教程
一 铭1 天前
Agent设计方式-工具调用:从自然语言到工具调用的桥梁
人工智能·大模型
xiaoxue..1 天前
大模型全栈技术图谱:LLM → Token → Context → Prompt → Tool → MCP → Agent → Skill
人工智能·ai·大模型
Shining05961 天前
AI 编译器系列(六)《Stable Diffusion 在 InfiniTensor 推理框架中的适配与工程实践》
人工智能·算法·stable diffusion·大模型·图像生成·ai编译器·infinitensor
庞轩px1 天前
2小时完成大模型推理网关:一次AI Coding实战记录
人工智能·大模型·笔试·ai编程·ai coding
星辰_mya2 天前
一封AI的介绍信
大模型·ai编程
twc8292 天前
大模型基础概念(简要版)
大模型·llm