【大模型】大模型项目选择 RAGvs微调?

RAG

输入问题,在知识库匹配知识,构建提示词:基于{知识}回答{问题}

微调

用知识问答对重新训练大模型权重,输入问题到调整后的大模型

如何选择

如果业务要求较高,RAG和微调可以一起使用

1-动态数据

复制代码
选择RAG
原因:RAG将数据存放到数据库即可,微调需要重新训练模型,微调成本大

2-模型能力定制

复制代码
选择微调
原因:用户想要回答有特殊口吻/专业内容等,如猫娘大模型/阅读研报/文本抽取内容,微调可以定制回答

3-幻觉

复制代码
选择RAG
原因:带有上下文知识的输入会减少模型幻觉的产生

4-可解释性

复制代码
选择RAG
原因:RAG可以给用户输出知识库数据供参考,提高回答可信度

5-成本

复制代码
选择RAG
原因:RAG只需要构建出知识图谱/知识数据库即可,而微调需要考虑数据集质量以及不断训练模型,微调成本高

6-依赖大模型通用能力

复制代码
选择RAG
原因:微调会改变大模型的权重,提高模型专业能力,但会降低模型通用能力(模型遗忘)

7-延迟

复制代码
选择微调
原因:RAG会有如知识库检索、排序、匹配等操作,会耗时

8-智能设备

复制代码
选择微调
原因:移动端小模型,业务场景需要突出专业能力
相关推荐
xixixi777777 小时前
NTN(神经张量网络):让AI学会“关系推理”的里程碑
网络·人工智能·神经网络·ai·大模型·ntn
懒猫gg10 小时前
大规模语言模型(LLM)
大模型·llm·gtp
我很哇塞耶12 小时前
Gemini手搓3D粒子特效,体验现实版钢铁侠
人工智能·ai·大模型
AI大模型产品经理12 小时前
混合专家模型MoE的全面指南(二)路由机制、负载均衡
人工智能·ai·语言模型·大模型·llm·ai大模型
人工智能培训12 小时前
循环神经网络讲解(2)
人工智能·rnn·深度学习·大模型·具身智能·大模型学习·大模型工程师
KG_LLM图谱增强大模型13 小时前
SciDaSynth:基于大语言模型的科学文献交互式结构化数据提取系统
数据库·人工智能·大模型·知识图谱
阿正的梦工坊13 小时前
FlowBench论文阅读:Workflow-Guided Planning for LLM-based Agents
人工智能·算法·大模型·llm
ariesjzj1 天前
DeepSeek时代的Large-scale LLM推理
大模型·llm·deepseek·推理优化·大规模ep
赋范大模型技术社区1 天前
大模型训练的“最后一公里”:为什么强化学习(RL)不可或缺?
大模型·微调·sft·模型训练·rl
愤怒的可乐1 天前
从零构建大模型智能体:构建可调用工具的智能体
人工智能·大模型·智能体框架