⼀、⼤模型与 Agent 开发
- ⼤模型应⽤发展与Agent前沿技术趋势
- ⼤模型应⽤的技术迭代过程 03:33
- ⼤模型的发展历程
o
-
-
- 技术萌芽期 :2022年底国外已开始激烈讨论⼤模型技术,国内认知普及始于2023
-
年ChatGPT问世
-
-
- 现象级突破 :ChatGPT作为对话式应⽤改变了⼈们对智能应⽤的认知,从机械式应答跃升⾄拟⼈化交互
- 技术对⽐ :传统智能客服(京东/淘宝)存在机械回答、频繁出错的特点,⽽⼤模型实现了⾃然语⾔理解与即时响应
- 技术跨越特征
-
o
-
-
- 交互⾰命 :突破传统机器学习模型需特定训练数据的限制(如分类任务/NER),实现跨领域问题解决
- 情感理解 :示例中GPT-4能识别"⼼情不好"的情绪状态,提供情感⽀持和建议(领导批评场景)
- ⻆⾊切换 :通过新建对话窗⼝即可实现不同⻆⾊扮演,体现单⼀模型的多元应⽤能⼒
- ⾏业影响
-
o
-
-
- ⾏业⾥程碑 :2023年被公认为"⼤模型元年",标志着⼈⼯智能进⼊新阶段
- 能⼒边界 :单个模型可处理语⾔理解、情感分析、知识问答等多模态任务
- 技术颠覆 :相⽐传统模型(需定制开发),⼤模型展现出"样样通"的通⽤智能特性
-
- AI Agent应⽤爆发的根本原因 08:55
- ⼤模型的技术跨越
o
-
-
- ⻆⾊切换能⼒ : 只需新建对话窗⼝即可化⾝全新伙伴,实现多⻆⾊⽆缝切换
- 技术突破性 : 突破传统AI需要特定数据训练的限制,直接解决各类问题
- ⾏业影响 : 将2023年确⽴为"⼤模型元年",标志着AI技术迈上新台阶
- ⽤户感知与技术实质的差异
-
o
-
-
- ⽤户视⻆ :
- 界⾯美观度提升
- 功能增量:图⽚/⽂件上传、插件构建等
- 产品形态保持对话式核⼼不变
- 技术本质 :
- 迭代速度远超其他领域
- 国内应⽤(如Kimi、⾖包)均保持对话核⼼
- 降低AI使⽤⻔槛:⽆需部署训练即可处理多任务
- ⽤户视⻆ :
- 技术发展的核⼼⽅向
- 模型能⼒增强
-
-
-
-
- &bsp;数据维度 :
- 数据量增⻓ : 可⽤训练数据持续增加(如GPT版本迭代中的数据集扩展)
- 数据质量提升 : 通过模型表现反馈优化数据筛选标准(如GPT-3到GPT-4的数据清洗改进)
- &bsp;训练⽅法 :
- 从传统微调(Fine-tuning)到⾼效适配(如LoRA)
- 训练效率提升:同量数据下模型吸收能⼒增强
- &bsp;数据维度 :
- 对话效果提升
- &bsp;原⽣能⼒ :
- 基于Transformer架构的预训练知识存储
- 类⽐:如⾼中⽣掌握学科知识后可直接解题
- &bsp;涌现能⼒ :
- 函数调⽤( Functtion Calling ) : 外部⼯具调⽤准确率提升(早期需详细描述,现可模糊匹配)
- Agentt 能⼒ : 专项训练实现的复杂任务处理能⼒(本课程核⼼内容)
- 类⽐:⾼考解题的举⼀反三能⼒
- &bsp;原⽣能⼒ :
-
- 技术栈迭代图示解析
-
o
-
-
- 训练侧 :
- 数据量↑ + 数据质量↑ → 模型原⽣能⼒↑
- 训练⽅法优化 → 训练效率↑
- 应⽤侧 :
- 提示⼯程+ 知识库→ 响应质量
- 检索增强⽣成+ 函数调⽤ → Agent能⼒
- 训练侧 :
-
- 构建Al Agent背后的核⼼理论 22:40
- ⼤模型能⼒提升的两个核⼼⽅向
- 原⽣能⼒提升 : ⼤模型⾃⾝的能⼒在不断变强,主要体现在数据处理和理解能⼒的增强。
- 对话效果提升 : ⼤模型的对话效果在⼤幅提升,能够更⾃然、准确地回应⽤户需求。
- ⼤模型技术栈迭代
- ⼤模型能⼒提升的两个核⼼⽅向
-
-
- 数据层⾯ : 数据量增加(Increased data volume)和数据质量提升(Improved data
-
quality)
-
-
- ⽅法层⾯ : 训练⽅法增强(Enhanced training methods)和功能调⽤能⼒(Function
-
calling capability)
-
-
- 涌现能⼒ : 包括Agent能⼒(Agent capability)和检索增强⽣成(Retrieval-Augmented
-
Generation)
-
- ⼤模型对话效果提升的挑战
o
-
-
- 知识库更新不及时 : ⼤模型的知识获取仅限于预训练或微调阶段,⽆法实时更新。例如询问"今天的天⽓怎么样?"时⽆法提供实时数据。
- ⼤模型幻觉问题 : 当⾯对不了解的问题时,⼤模型可能会产⽣不准确或虚构的回答。
- 提示⼯程(Stage 1)
-
o
-
-
- In-Conttextt Learning : 通过提供少量标注的"输⼊-输出对"示例,在不进⾏微调的情况下改善输出质量。
- 应⽤示例 : 当询问天⽓时,先⼿动提供天⽓数据,再让模型基于这些数据⽣成回答。
- 局限性 : 需要⼈⼯介⼊,⽆法实现完全⾃动化。
- 函数调⽤(Stage 2)
-
o
-
-
- ⾃主决策 : 模型能智能选择⼯具来回答问题,如⾃动调⽤天⽓API获取实时数据。
- 可靠解析 : 响应采⽤JSON格式⽽⾮⾃然语⾔,便于程序处理。
- 实现原理 : 提供⽤户定义的JSON字符串描述⼯具功能,模型⾃主判断是否需要调
-
⽤。
-
-
- 应⽤优势 : 解决了知识库更新不及时问题,扩展了⼤模型的应⽤范围。
-
- Agent背后的AgentExecutor 40:09
- 函数调⽤的成熟应⽤
o
-
-
- 技术成熟度 : 函数调⽤技术已趋于成熟,成为连接外部系统的标准⽅式。
- 应⽤场景 : 可连接结构化API、本地数据库、⾃定义Python函数等。
- 实际案例 : 询问天⽓时,模型⾃动搜索⽹站获取实时数据并⽣成回答。
- 当前⾯临的挑战
-
o
-
-
- 幻觉问题 : 当⾯对不了解的问题时,模型可能产⽣不准确回答。例如新员⼯询问公司注意事项时,模型会⽣成通⽤但可能不准确的建议。
- 解决⽅案需求 : 需要进⼀步的技术迭代来解决幻觉问题,提升回答的准确性。
-
⼆、知识⼩结
|-----|------|------------|------|
| 知识点 | 核⼼内容 | 考试重点/易 混淆点 | 难度系数 |
|-----------------------------------------------------|-------------------------------------------------|----------------------------|------|
| ⼤模型原⽣能 ⼒ | 通过预训练和微调 ⽅法(如 Transformer架构)从数据中学习知 识,直接回答⽤户 问题 | 原⽣能⼒与涌现能⼒的区别 | ★★★ |
| ⼤模型涌现能 ⼒ | 基于已学知识举⼀反三(如函数调 ⽤、Agent能⼒) | 如何通过专项训练增强涌现 能⼒ | ★★★★ |
| 知识库更新问 题 | ⼤模型训练数据存在时效性局限(如示例中GPT-4知识 截⽌2023年10⽉) | 实时信息需依赖外部⼯具补充 | ★★ |
| 提示⼯程 ( In- Conttextt Learning ) | 通过输⼊输出示例引导模型⽣成未知领域回答(如天⽓ 查询案例) | 示例构造的精准性影响效果 | ★★★ |
| 函数调⽤ ( Functtion Calling ) | 模型⾃主决策调⽤外部API(如天⽓接⼝)并解析返回 数据⽣成回复 | JSON 结构解析与⼯具描述的关键性 | ★★★★ |
| 技术迭代阶段 | 从原⽣对话→提示 ⼯程→函数调⽤ →Agent开发的演 进路径 | 各阶段技术瓶颈与解决⽅案对⽐ | ★★★★ |
| 幻觉问题 | 模型⽣成与事实不符的内容(未在⽂ 本中展开) | 幻觉与知识缺失的区分 | ★★★★ |