大模型学习2

微调,在已经成熟的经过了预训练,SFT,RLHF这些操作过后进行的客制化操作。 --模型能不足或者希望固化一些知识省promote的时候

1.全参微调 需要至少80G以上的显存

2.PEFT,LoRA低秩适配

稳定性:微调

新语言新方式:续训。 成本高高高高。

RAG外挂知识库。 成本低一点RAG。

智能体:

1.大语言模型的大脑 2.有记忆 3.会用调用工具 4.可以去进行规划决策 5.可以执行某个操作

工具调用:1.function call 不足:工具实现与服用比较复杂。可能代码没有很多健壮性的考虑禁不起测试。

MCP标准,标准化工程函数。工具统一化

RAG --大模型知识冻结 减少幻觉 类似开卷考试。

检索语义相近的内容

相关推荐
徒 花2 小时前
HCIP学习05 链路聚合(Eth-Trunk)+ VRRP
服务器·网络·学习·hcip
黑金IT2 小时前
AI Agent “小龙虾终极进化”——自主学习与持久化记忆的架构实现
人工智能·学习·架构
weixin_395772472 小时前
计算机网络学习笔记】初始网络之网络发展和OSI七层模型
笔记·学习·计算机网络
南境十里·墨染春水2 小时前
linux学习进展 进程的内存管理
linux·服务器·学习
小陈phd3 小时前
多模态大模型学习笔记(三十四)——ChatTTS:新一代中文语音合成工具原理与实战解析
笔记·学习·语音识别
zhangrelay3 小时前
面向机器人工程的 Linux 发行版:科学选型与深度评测-2026
笔记·学习
网络工程小王3 小时前
【Function Calling详解】(学习笔记)
笔记·学习
新手小新3 小时前
通信工程师学习笔记3-电信网间互联管理规定和网络安全法
网络·笔记·学习
red_redemption3 小时前
自由学习记录(163)
学习