【大模型】大模型项目选择 RAGvs微调?

RAG

输入问题,在知识库匹配知识,构建提示词:基于{知识}回答{问题}

微调

用知识问答对重新训练大模型权重,输入问题到调整后的大模型

如何选择

如果业务要求较高,RAG和微调可以一起使用

1-动态数据

复制代码
选择RAG
原因:RAG将数据存放到数据库即可,微调需要重新训练模型,微调成本大

2-模型能力定制

复制代码
选择微调
原因:用户想要回答有特殊口吻/专业内容等,如猫娘大模型/阅读研报/文本抽取内容,微调可以定制回答

3-幻觉

复制代码
选择RAG
原因:带有上下文知识的输入会减少模型幻觉的产生

4-可解释性

复制代码
选择RAG
原因:RAG可以给用户输出知识库数据供参考,提高回答可信度

5-成本

复制代码
选择RAG
原因:RAG只需要构建出知识图谱/知识数据库即可,而微调需要考虑数据集质量以及不断训练模型,微调成本高

6-依赖大模型通用能力

复制代码
选择RAG
原因:微调会改变大模型的权重,提高模型专业能力,但会降低模型通用能力(模型遗忘)

7-延迟

复制代码
选择微调
原因:RAG会有如知识库检索、排序、匹配等操作,会耗时

8-智能设备

复制代码
选择微调
原因:移动端小模型,业务场景需要突出专业能力
相关推荐
精致先生3 小时前
RAG(检索增强生成)
人工智能·大模型·rag
威化饼的一隅9 小时前
【多模态】天池AFAC赛道四-智能体赋能的金融多模态报告自动化生成part1-数据获取
大模型·agent·多模态·智能体
美林数据Tempodata11 小时前
美林数据用大模型重构电能质量评估,让隐蔽合规问题无所遁形
重构·大模型
胡耀超1 天前
我们如何写好提示词、发挥LLM能力、写作指南:从认知分析到动态构建的思维方法
人工智能·python·学习·大模型·llm·提示词·八要素思维
文浩(楠搏万)2 天前
XTTS实现语音克隆:精确控制音频格式与生成流程【TTS的实战指南】
大模型·tts·克隆·语音·声音克隆·音色·xtts
您的通讯录好友2 天前
TechGPT2部署
linux·人工智能·python·大模型·techgpt
之之为知知2 天前
Chromadb 1.0.15 索引全解析:从原理到实战的向量检索优化指南
人工智能·深度学习·机器学习·大模型·索引·向量数据库·chromadb
想躺平的咸鱼干3 天前
大模型开发
ai·大模型·ai应用开发技术架构
ATM0063 天前
MetaGPT源码剖析(三):多智能体系统的 “智能角色“ 核心实现——Role类
人工智能·大模型·agent·源码剖析·metagpt