【大模型】大模型项目选择 RAGvs微调?

RAG

输入问题,在知识库匹配知识,构建提示词:基于{知识}回答{问题}

微调

用知识问答对重新训练大模型权重,输入问题到调整后的大模型

如何选择

如果业务要求较高,RAG和微调可以一起使用

1-动态数据

复制代码
选择RAG
原因:RAG将数据存放到数据库即可,微调需要重新训练模型,微调成本大

2-模型能力定制

复制代码
选择微调
原因:用户想要回答有特殊口吻/专业内容等,如猫娘大模型/阅读研报/文本抽取内容,微调可以定制回答

3-幻觉

复制代码
选择RAG
原因:带有上下文知识的输入会减少模型幻觉的产生

4-可解释性

复制代码
选择RAG
原因:RAG可以给用户输出知识库数据供参考,提高回答可信度

5-成本

复制代码
选择RAG
原因:RAG只需要构建出知识图谱/知识数据库即可,而微调需要考虑数据集质量以及不断训练模型,微调成本高

6-依赖大模型通用能力

复制代码
选择RAG
原因:微调会改变大模型的权重,提高模型专业能力,但会降低模型通用能力(模型遗忘)

7-延迟

复制代码
选择微调
原因:RAG会有如知识库检索、排序、匹配等操作,会耗时

8-智能设备

复制代码
选择微调
原因:移动端小模型,业务场景需要突出专业能力
相关推荐
Ai野生菌11 小时前
工具介绍 | SafeLLMDeploy教程来了 保护本地LLM安全部署
网络·人工智能·安全·大模型·llm
a里啊里啊11 小时前
AI提示词收集(持续更新)
ai·大模型·prompt·开发·提示词
未来智慧谷1 天前
DeepSeek大模型在政务服务领域的应用
大模型·政务·deepseek
kcarly1 天前
DeepSeek 都开源了哪些技术?
开源·大模型·llm·deepseek
狂奔solar1 天前
Minimind 训练一个自己专属语言模型
大模型·minimind
王亭_6661 天前
Ollama+open-webui搭建私有本地大模型详细教程
人工智能·大模型·ollama·openwebui·deepseek
开始学AI1 天前
【Windows+Cursor】从0到1配置Arxiv MCP Server,实现论文自主查询、下载、分析、综述生成
语言模型·大模型·ai agent·mcp
Mr.zwX2 天前
【完整版】DeepSeek-R1大模型学习笔记(架构、训练、Infra、复现代码)
大模型·deepseek
禁默2 天前
智能体开发基础:从概念到实现
人工智能·大模型·智能体
青花瓷2 天前
智谱大模型(ChatGLM3)PyCharm的调试指南
人工智能·python·大模型·智谱大模型