第9课：LangMem SDK高效实现长期记忆管理 - 学习笔记_9

第9课：LangMem SDK高效实现长期记忆管理 - 学习笔记

📚 课程核心主题

本节课深入讲解如何通过LangMem SDK高效实现长期记忆管理，包括模型微调的重要性、垂直领域模型训练、AI系统设计边界等核心概念。

🎯 第一部分：模型能力是核心

规划、观察和执行的基础

核心理解

是什么：

规划、观察和执行这些能力不是Agent本身的能力
而是依托于模型（LM）自身的能力
是模型的自我认知能力

关键点：

❌ 如果模型能力不行，Agent设计得再好也没用
✅ 模型的能力必须足够强
✅ 这是整个系统的核心基础

类比理解：

就像一辆车，发动机不行，再好的车身也没用
模型就是AI系统的"发动机"
Agent只是"车身"，提供功能框架

垂直领域模型的重要性

通用模型 vs 垂直模型

通用模型的问题：

❌ 在垂直领域表现不佳
❌ 无法深入理解特定业务场景
❌ 效果不理想

垂直模型的优势：

✅ 针对特定领域训练
✅ 更深入理解业务场景
✅ 效果更好

实际场景：

通用模型（如DeepSeek）：适合通用场景
垂直模型：针对特定业务场景训练
例如：医疗、法律、金融等垂直领域

🔧 第二部分：模型微调的必要性

为什么需要微调？

核心原因

问题：

如何让模型更好地理解用户的诉求？
如何提升模型在垂直领域的表现？

解决方案：模型微调（Fine-tuning）

是什么：

对预训练模型进行微调
使用垂直领域的数据训练
让模型更懂特定业务场景

关键理解：

✅ 这是AI大模型应用开发者必须掌握的能力
✅ 没有这个能力，只能做最简单的应用
✅ 无法真正落地生产级系统

微调的重要性

实际生产环境

企业实际需求：

✅ 使用小参数模型（如7B模型）
✅ 本地私有化部署
❌ 不使用API模型

原因：数据安全

在AI时代，数据安全最重要
数据是企业的核心资产
不能把数据交给第三方API

关键点：

数据才是壁垒
只有有了数据，才能做数据的AI化
才能形成垂直应用的闭环

微调的价值

为什么很多企业做不好AI？

问题：

❌ 没有数据
❌ 不知道怎么做数据的AI化
❌ 不知道怎么训练垂直模型
❌ 不知道如何使用

结果：

只能使用通用API（如DeepSeek）
效果不行
幻觉严重
理解不了业务场景

解决方案：

✅ 必须做模型微调
✅ 让模型更懂业务场景
✅ 更理解语义和意图

关键理解：

微调是整个应用的核心
上面的应用层只是组件化开发
真正的核心是模型微调

📊 第三部分：模型选择策略

小参数模型 vs 大参数模型

生产环境的选择

推荐：小参数模型

✅ 1.5B到7B的模型
✅ 适合本地部署
✅ 成本低、效率高

不推荐：大参数模型

❌ 参数量太大
❌ 部署成本高
❌ 不适合企业级应用

关键点：

从成本、效率、性能、精度等各方面考虑
小参数模型更适合落地
这是企业级应用的趋势

🎨 第四部分：AI系统设计的边界

AI Native应用 vs AI增强应用

两种应用模式

模式1：AI Native应用

纯AI的全新应用
从零开始设计
适合新场景

模式2：AI增强应用（推荐）

现有应用 + AI增强
在特定场景或功能上使用AI
提高生产力、效率、用户体验

关键理解：

✅ 大部分企业应该用AI增强模式
✅ 不能把原来所有东西都废掉
✅ AI是赋能，不是替代

AI系统的边界

实际案例：订单系统

问题： AI能下订单吗？

答案： 不能完全下订单

AI的作用：

✅ 自动识别用户输入（语音或文本）
✅ 调用工具填写表单
✅ 完成表单填写

后端系统的作用：

✅ 真正的下订单业务
✅ 订单系统的核心逻辑
✅ 数据保存和业务处理

关键理解：

AI只负责识别和表单填写
真正的业务逻辑还在后端系统
两者需要结合和集成

常见误区

错误认知：

❌ "整个CRM系统能不能用AI实现？"
❌ "订单系统能不能用AI实现？"

正确理解：

✅ AI系统的设计有边界
✅ AI不是万能的
✅ 需要明确AI能做什么、不能做什么

关键点：

很多企业都搞不清楚AI的边界
导致项目失败
需要正确理解AI的能力范围

💼 第五部分：AI应用开发者的能力要求

两类人群最吃香

第一类：有开发经验的程序员

背景：

Java程序员
大数据开发等
有实际开发经验

优势：

✅ 有编程基础
✅ 理解系统架构
✅ 能快速上手AI开发

关键理解：

以后不管做什么开发，都会用AI重塑
在某些环节、功能点、需求上会用AI化
这是趋势

第二类：产品经理

背景：

互联网产品经理
制造业产品经理等
有产品设计经验

优势：

✅ 理解业务需求
✅ 知道如何降本增效
✅ 能设计AI化的产品交互模式

关键理解：

如何把原来的产品通过AI降本增效？
如何提高用户体验？
如何聚焦通过AI打造新的交互模式？

就业前景

市场需求：

✅ 企业招不到合适的人
✅ 大部分人都是一知半解
✅ 真正懂AI应用开发的人很少

薪资水平：

✅ 三本学历也能拿到高薪
✅ 深圳地区3万+月薪
✅ 还有季度奖金

关键点：

不是学历问题，是能力问题
需要有完整的体系化知识
需要有落地的项目经验

🎓 第六部分：如何成为合格的AI应用开发者

核心能力要求

1. 完整的体系化认知

需要掌握：

✅ AI的边界
✅ 需求AI化
✅ 数据AI化
✅ 与现有业务系统的结合和集成

关键理解：

不是会RAG、Agent就能找工作
需要有全盘的认知
需要理解整个AI应用开发的体系

2. 项目解决方案能力

需要能够：

✅ 提出各种解决方案
✅ 清晰阐述技术亮点
✅ 说明项目效果
✅ 说明遇到的坑和解决方案

关键点：

技术选型：为什么这么选？
AI数据方案：怎么做的？
AI技术方案：用了哪些方案？
评测和评估：怎么做的？
优化方案：后续怎么优化？

3. 解决实际问题的能力

实际案例：RAG效果不好

问题：

回答不全面
有幻觉
效果不行

解决方案：

✅ 对RAG的每个阶段都要优化
✅ 包括微调
✅ 包括trunk（分块）
✅ 特别是语料的结构化处理
✅ 数据清洗

关键理解：

不是把文档往RAG框架里一拖就行
需要精细化的处理
需要数据清洗和结构化

编码能力要求

重要提醒：

❌ 不要以为轻代码、无代码就能搞定
✅ 编码能力还是有要求的
✅ 零代码无法搞定AI落地

关键理解：

AI代码生成工具越来越强
但编码能力仍然重要
需要理解代码逻辑和系统架构

💡 关键概念总结

概念	简单理解
模型能力	规划、观察、执行的基础，是系统的核心
垂直模型	针对特定领域训练的模型，效果更好
模型微调	使用垂直领域数据训练模型，必须掌握的能力
小参数模型	1.5B-7B模型，适合本地部署，成本低
AI增强应用	现有应用+AI增强，在特定场景使用AI
AI系统边界	AI不是万能的，需要明确能做什么、不能做什么
数据AI化	将企业数据转化为AI可用的格式
需求AI化	将业务需求转化为AI可解决的问题

❓ 思考题

为什么说模型能力是核心？
- 答：规划、观察、执行这些能力不是Agent本身的能力，而是依托于模型自身的能力。如果模型能力不行，Agent设计得再好也没用。模型就像"发动机"，是整个系统的核心基础。
为什么需要模型微调？
- 答：通用模型在垂直领域表现不佳，无法深入理解特定业务场景。通过微调，使用垂直领域的数据训练模型，让模型更懂业务场景，更理解语义和意图。这是AI应用开发者必须掌握的能力。
AI Native应用和AI增强应用的区别？
- 答：AI Native应用是纯AI的全新应用，从零开始设计；AI增强应用是现有应用+AI增强，在特定场景或功能上使用AI，提高生产力、效率、用户体验。大部分企业应该用AI增强模式。
AI系统的边界是什么？
- 答：AI不是万能的，需要明确AI能做什么、不能做什么。例如，AI可以识别用户输入、填写表单，但真正的业务逻辑（如下订单）还需要后端系统完成。AI只负责识别和表单填写，需要与后端系统结合。
如何成为合格的AI应用开发者？
- 答：需要具备：①完整的体系化认知（AI边界、需求AI化、数据AI化等）；②项目解决方案能力（能提出方案、阐述技术亮点、说明效果）；③解决实际问题的能力（优化RAG、数据清洗等）；④编码能力（理解代码逻辑和系统架构）。

📌 本节课重点回顾

✅ 模型能力是核心： 规划、观察、执行依托于模型自身能力，不是Agent的能力

✅ 模型微调必要： 必须掌握微调能力，让模型更懂业务场景，这是应用的核心

✅ 小参数模型： 1.5B-7B模型适合生产环境，成本低、效率高

✅ AI系统边界： AI不是万能的，需要明确能做什么、不能做什么

✅ 能力要求： 需要完整的体系化认知、项目解决方案能力、解决实际问题的能力

笔记整理时间：2024年
建议：理解模型微调的重要性和AI系统的边界是构建企业级AI应用的关键，需要系统化学习和实践