大模型应用发展与Agent前沿技术趋势

⼀、⼤模型与 Agent 开发

⼤模型应⽤发展与Agent前沿技术趋势

⼤模型应⽤的技术迭代过程 03:33
1. ⼤模型的发展历程

- - 技术萌芽期 ：2022年底国外已开始激烈讨论⼤模型技术，国内认知普及始于2023

年ChatGPT问世

- - 现象级突破 ：ChatGPT作为对话式应⽤改变了⼈们对智能应⽤的认知，从机械式应答跃升⾄拟⼈化交互
  - 技术对⽐ ：传统智能客服（京东/淘宝）存在机械回答、频繁出错的特点，⽽⼤模型实现了⾃然语⾔理解与即时响应
- 技术跨越特征

- - 交互⾰命 ：突破传统机器学习模型需特定训练数据的限制（如分类任务/NER），实现跨领域问题解决
  - 情感理解 ：示例中GPT-4能识别"⼼情不好"的情绪状态，提供情感⽀持和建议（领导批评场景）
  - ⻆⾊切换 ：通过新建对话窗⼝即可实现不同⻆⾊扮演，体现单⼀模型的多元应⽤能⼒
- ⾏业影响

- - ⾏业⾥程碑 ：2023年被公认为"⼤模型元年"，标志着⼈⼯智能进⼊新阶段
  - 能⼒边界 ：单个模型可处理语⾔理解、情感分析、知识问答等多模态任务
  - 技术颠覆 ：相⽐传统模型（需定制开发），⼤模型展现出"样样通"的通⽤智能特性
AI Agent应⽤爆发的根本原因 08:55
1. ⼤模型的技术跨越

- - ⻆⾊切换能⼒ : 只需新建对话窗⼝即可化⾝全新伙伴，实现多⻆⾊⽆缝切换
  - 技术突破性 : 突破传统AI需要特定数据训练的限制，直接解决各类问题
  - ⾏业影响 : 将2023年确⽴为"⼤模型元年"，标志着AI技术迈上新台阶
- ⽤户感知与技术实质的差异

- - ⽤户视⻆ :
    1. 界⾯美观度提升
    2. 功能增量：图⽚/⽂件上传、插件构建等
    3. 产品形态保持对话式核⼼不变
  - 技术本质 :
    1. 迭代速度远超其他领域
    2. 国内应⽤（如Kimi、⾖包）均保持对话核⼼
    3. 降低AI使⽤⻔槛：⽆需部署训练即可处理多任务
- 技术发展的核⼼⽅向
  - 模型能⼒增强

1. 1. 1. &bsp;数据维度 :
      1. 数据量增⻓ : 可⽤训练数据持续增加（如GPT版本迭代中的数据集扩展）
      2. 数据质量提升 : 通过模型表现反馈优化数据筛选标准（如GPT-3到GPT-4的数据清洗改进）
    2. &bsp;训练⽅法 :
      1. 从传统微调（Fine-tuning）到⾼效适配（如LoRA）
      2. 训练效率提升：同量数据下模型吸收能⼒增强
  2. 对话效果提升
    1. &bsp;原⽣能⼒ :
      1. 基于Transformer架构的预训练知识存储
      2. 类⽐：如⾼中⽣掌握学科知识后可直接解题
    2. &bsp;涌现能⼒ :
      1. 函数调⽤（ Functtion Calling ） : 外部⼯具调⽤准确率提升（早期需详细描述，现可模糊匹配）
      2. Agentt 能⼒ : 专项训练实现的复杂任务处理能⼒（本课程核⼼内容）
      3. 类⽐：⾼考解题的举⼀反三能⼒
2. 技术栈迭代图示解析

- - 训练侧 :
    1. 数据量↑ + 数据质量↑ → 模型原⽣能⼒↑
    2. 训练⽅法优化 → 训练效率↑
  - 应⽤侧 :
    1. 提示⼯程+ 知识库→ 响应质量
    2. 检索增强⽣成+ 函数调⽤ → Agent能⼒
构建Al Agent背后的核⼼理论 22:40
1. ⼤模型能⼒提升的两个核⼼⽅向
  - 原⽣能⼒提升 : ⼤模型⾃⾝的能⼒在不断变强，主要体现在数据处理和理解能⼒的增强。
  - 对话效果提升 : ⼤模型的对话效果在⼤幅提升，能够更⾃然、准确地回应⽤户需求。
2. ⼤模型技术栈迭代

- - 数据层⾯ : 数据量增加(Increased data volume)和数据质量提升(Improved data

quality)

- - ⽅法层⾯ : 训练⽅法增强(Enhanced training methods)和功能调⽤能⼒(Function

calling capability)

- - 涌现能⼒ : 包括Agent能⼒(Agent capability)和检索增强⽣成(Retrieval-Augmented

Generation)

1. ⼤模型对话效果提升的挑战

- - 知识库更新不及时 : ⼤模型的知识获取仅限于预训练或微调阶段，⽆法实时更新。例如询问"今天的天⽓怎么样？"时⽆法提供实时数据。
  - ⼤模型幻觉问题 : 当⾯对不了解的问题时，⼤模型可能会产⽣不准确或虚构的回答。
- 提示⼯程(Stage 1)

- - In-Conttextt Learning : 通过提供少量标注的"输⼊-输出对"示例，在不进⾏微调的情况下改善输出质量。
  - 应⽤示例 : 当询问天⽓时，先⼿动提供天⽓数据，再让模型基于这些数据⽣成回答。
  - 局限性 : 需要⼈⼯介⼊，⽆法实现完全⾃动化。
- 函数调⽤(Stage 2)

- - ⾃主决策 : 模型能智能选择⼯具来回答问题，如⾃动调⽤天⽓API获取实时数据。
  - 可靠解析 : 响应采⽤JSON格式⽽⾮⾃然语⾔，便于程序处理。
  - 实现原理 : 提供⽤户定义的JSON字符串描述⼯具功能，模型⾃主判断是否需要调

⽤。

- - 应⽤优势 : 解决了知识库更新不及时问题，扩展了⼤模型的应⽤范围。
Agent背后的AgentExecutor 40:09
1. 函数调⽤的成熟应⽤

- - 技术成熟度 : 函数调⽤技术已趋于成熟，成为连接外部系统的标准⽅式。
  - 应⽤场景 : 可连接结构化API、本地数据库、⾃定义Python函数等。
  - 实际案例 : 询问天⽓时，模型⾃动搜索⽹站获取实时数据并⽣成回答。
- 当前⾯临的挑战

- - 幻觉问题 : 当⾯对不了解的问题时，模型可能产⽣不准确回答。例如新员⼯询问公司注意事项时，模型会⽣成通⽤但可能不准确的建议。
  - 解决⽅案需求 : 需要进⼀步的技术迭代来解决幻觉问题，提升回答的准确性。

⼆、知识⼩结

|-----|------|------------|------|
| 知识点 | 核⼼内容 | 考试重点/易混淆点 | 难度系数 |

|-----------------------------------------------------|-------------------------------------------------|----------------------------|------|
| ⼤模型原⽣能 ⼒ | 通过预训练和微调⽅法（如 Transformer架构）从数据中学习知识，直接回答⽤户问题 | 原⽣能⼒与涌现能⼒的区别 | ★★★ |
| ⼤模型涌现能 ⼒ | 基于已学知识举⼀反三（如函数调⽤、Agent能⼒） | 如何通过专项训练增强涌现能⼒ | ★★★★ |
| 知识库更新问 题 | ⼤模型训练数据存在时效性局限（如示例中GPT-4知识截⽌2023年10⽉） | 实时信息需依赖外部⼯具补充 | ★★ |
| 提示⼯程 （ In- Conttextt Learning ） | 通过输⼊输出示例引导模型⽣成未知领域回答（如天⽓查询案例） | 示例构造的精准性影响效果 | ★★★ |
| 函数调⽤ （ Functtion Calling ） | 模型⾃主决策调⽤外部API（如天⽓接⼝）并解析返回数据⽣成回复 | JSON 结构解析与⼯具描述的关键性 | ★★★★ |
| 技术迭代阶段 | 从原⽣对话→提示⼯程→函数调⽤ →Agent开发的演进路径 | 各阶段技术瓶颈与解决⽅案对⽐ | ★★★★ |
| 幻觉问题 | 模型⽣成与事实不符的内容（未在⽂本中展开） | 幻觉与知识缺失的区分 | ★★★★ |