【大模型】大模型项目选择 RAGvs微调?

RAG

输入问题,在知识库匹配知识,构建提示词:基于{知识}回答{问题}

微调

用知识问答对重新训练大模型权重,输入问题到调整后的大模型

如何选择

如果业务要求较高,RAG和微调可以一起使用

1-动态数据

复制代码
选择RAG
原因:RAG将数据存放到数据库即可,微调需要重新训练模型,微调成本大

2-模型能力定制

复制代码
选择微调
原因:用户想要回答有特殊口吻/专业内容等,如猫娘大模型/阅读研报/文本抽取内容,微调可以定制回答

3-幻觉

复制代码
选择RAG
原因:带有上下文知识的输入会减少模型幻觉的产生

4-可解释性

复制代码
选择RAG
原因:RAG可以给用户输出知识库数据供参考,提高回答可信度

5-成本

复制代码
选择RAG
原因:RAG只需要构建出知识图谱/知识数据库即可,而微调需要考虑数据集质量以及不断训练模型,微调成本高

6-依赖大模型通用能力

复制代码
选择RAG
原因:微调会改变大模型的权重,提高模型专业能力,但会降低模型通用能力(模型遗忘)

7-延迟

复制代码
选择微调
原因:RAG会有如知识库检索、排序、匹配等操作,会耗时

8-智能设备

复制代码
选择微调
原因:移动端小模型,业务场景需要突出专业能力
相关推荐
带娃的IT创业者1 小时前
本地AI的觉醒:GitNexus如何让GenAI从云端走向你的口袋
人工智能·大模型·边缘计算·开源项目·genai·本地ai·gitnexus
codefan※5 小时前
day05-llm-sampling-params
人工智能·大模型·llm·prompt工程·top-p·temperature·ai应用开发
是Yu欸5 小时前
从 Prompt 到 WebUI:基于 SenseNova U1 封装一个图文技术博客生成工具
大模型·llm·prompt·webui·moe·sensenova u1·商汤科技
qq_525513758 小时前
第七章 大模型学习(六) Evaluating the fine-tuned LLM and Conclusion
python·学习·语言模型·大模型
是Yu欸9 小时前
CC-Switch 零基础保姆级教程1(2026 最新版)
网络·人工智能·网络协议·http·大模型·claude·claude desktop
蓝桉~MLGT10 小时前
Ai-Agent学习历程—— 阶段2——LangChain Core(基本调用、tools、简单上下文等)
学习·大模型·agent
搞科研的小刘选手12 小时前
【人工智能方向专题研讨会】第二届商业生成式人工智能国际学术会议(GAIB 2026)
人工智能·计算机·大模型·区块链·智能·商业·经管
这是谁的博客?13 小时前
大模型分布式训练技术深度解析:从 ZeRO 到 3D 并行的全面指南
分布式·ai·大模型·分布式训练·deepspeed·fsdp·zero
带娃的IT创业者13 小时前
本地化AI的觉醒:从GitHub热门项目看端侧大模型的未来
人工智能·后端·大模型·github·端侧大模型·本地化ai
Mininglamp_271813 小时前
在Mac上跑大模型,MLX 不是终点
大模型·apple silicon·mlx·端侧推理·激活量化