【大模型】大模型项目选择 RAGvs微调?

RAG

输入问题,在知识库匹配知识,构建提示词:基于{知识}回答{问题}

微调

用知识问答对重新训练大模型权重,输入问题到调整后的大模型

如何选择

如果业务要求较高,RAG和微调可以一起使用

1-动态数据

选择RAG
原因:RAG将数据存放到数据库即可,微调需要重新训练模型,微调成本大

2-模型能力定制

选择微调
原因:用户想要回答有特殊口吻/专业内容等,如猫娘大模型/阅读研报/文本抽取内容,微调可以定制回答

3-幻觉

选择RAG
原因:带有上下文知识的输入会减少模型幻觉的产生

4-可解释性

选择RAG
原因:RAG可以给用户输出知识库数据供参考,提高回答可信度

5-成本

选择RAG
原因:RAG只需要构建出知识图谱/知识数据库即可,而微调需要考虑数据集质量以及不断训练模型,微调成本高

6-依赖大模型通用能力

选择RAG
原因:微调会改变大模型的权重,提高模型专业能力,但会降低模型通用能力(模型遗忘)

7-延迟

选择微调
原因:RAG会有如知识库检索、排序、匹配等操作,会耗时

8-智能设备

选择微调
原因:移动端小模型,业务场景需要突出专业能力
相关推荐
玩电脑的辣条哥3 天前
如何将自己本地项目开源到github上?
大模型·github·api·ollama
DogDaoDao4 天前
AI 大爆发时代,音视频未来路在何方?
人工智能·ai·大模型·音视频·视频编解码
uncle_ll4 天前
ChatGPT大模型极简应用开发-目录
人工智能·gpt·chatgpt·大模型·llm
uncle_ll5 天前
ChatGPT大模型极简应用开发-CH1-初识 GPT-4 和 ChatGPT
人工智能·gpt·chatgpt·大模型·llm
青禾tester5 天前
【AI落地】如何创建字节的coze扣子工作流 ——以“批量获取抖音视频文案”为例
人工智能·经验分享·gpt·大模型·字节跳动·coze扣子
大模型之路6 天前
MiniCPM-o 2.6:开源大型语言模型在多模态任务上超越GPT-4o和Claude 3.5
人工智能·语言模型·大模型·多模态·minicpm-o 2.6
杀生丸学AI7 天前
【AIGC】SYNCAMMASTER:多视角多像机的视频生成
人工智能·大模型·aigc·文生视频·svd·扩散模型·视频生成
大模型之路7 天前
微软震撼发布:Phi-4语言模型登陆Hugging Face
人工智能·microsoft·语言模型·大模型·llm·phi-4
TFATS8 天前
使用 LLaMA-Factory 微调大模型
人工智能·深度学习·自然语言处理·大模型·aigc
木亦汐丫8 天前
【大模型系列篇】数字人音唇同步模型——腾讯开源MuseTalk
大模型·数字人·口型同步·musev·musetalk·ffmpeg-static