大模型应用发展与Agent前沿技术趋势

⼀、⼤模型与 Agent 开发

  1. ⼤模型应⽤发展与Agent前沿技术趋势
  1. ⼤模型应⽤的技术迭代过程 03:33
    1. ⼤模型的发展历程

o

      • 技术萌芽期 :2022年底国外已开始激烈讨论⼤模型技术,国内认知普及始于2023

年ChatGPT问世

      • 现象级突破 :ChatGPT作为对话式应⽤改变了⼈们对智能应⽤的认知,从机械式应答跃升⾄拟⼈化交互
      • 技术对⽐ :传统智能客服(京东/淘宝)存在机械回答、频繁出错的特点,⽽⼤模型实现了⾃然语⾔理解与即时响应
    • 技术跨越特征

o

      • 交互⾰命 :突破传统机器学习模型需特定训练数据的限制(如分类任务/NER),实现跨领域问题解决
      • 情感理解 :示例中GPT-4能识别"⼼情不好"的情绪状态,提供情感⽀持和建议(领导批评场景)
      • ⻆⾊切换 :通过新建对话窗⼝即可实现不同⻆⾊扮演,体现单⼀模型的多元应⽤能⼒
    • ⾏业影响

o

      • ⾏业⾥程碑 :2023年被公认为"⼤模型元年",标志着⼈⼯智能进⼊新阶段
      • 能⼒边界 :单个模型可处理语⾔理解、情感分析、知识问答等多模态任务
      • 技术颠覆 :相⽐传统模型(需定制开发),⼤模型展现出"样样通"的通⽤智能特性
  1. AI Agent应⽤爆发的根本原因 08:55
    1. ⼤模型的技术跨越

o

      • ⻆⾊切换能⼒ : 只需新建对话窗⼝即可化⾝全新伙伴,实现多⻆⾊⽆缝切换
      • 技术突破性 : 突破传统AI需要特定数据训练的限制,直接解决各类问题
      • ⾏业影响 : 将2023年确⽴为"⼤模型元年",标志着AI技术迈上新台阶
    • ⽤户感知与技术实质的差异

o

      • ⽤户视⻆ :
        1. 界⾯美观度提升
        2. 功能增量:图⽚/⽂件上传、插件构建等
        3. 产品形态保持对话式核⼼不变
      • 技术本质 :
        1. 迭代速度远超其他领域
        2. 国内应⽤(如Kimi、⾖包)均保持对话核⼼
        3. 降低AI使⽤⻔槛:⽆需部署训练即可处理多任务
    • 技术发展的核⼼⽅向
      • 模型能⼒增强
        1. &bsp;数据维度 :
          1. 数据量增⻓ : 可⽤训练数据持续增加(如GPT版本迭代中的数据集扩展)
          2. 数据质量提升 : 通过模型表现反馈优化数据筛选标准(如GPT-3到GPT-4的数据清洗改进)
        2. &bsp;训练⽅法 :
          1. 从传统微调(Fine-tuning)到⾼效适配(如LoRA)
          2. 训练效率提升:同量数据下模型吸收能⼒增强
      1. 对话效果提升
        1. &bsp;原⽣能⼒ :
          1. 基于Transformer架构的预训练知识存储
          2. 类⽐:如⾼中⽣掌握学科知识后可直接解题
        2. &bsp;涌现能⼒ :
          1. 函数调⽤( Functtion Calling : 外部⼯具调⽤准确率提升(早期需详细描述,现可模糊匹配)
          2. Agentt 能⼒ : 专项训练实现的复杂任务处理能⼒(本课程核⼼内容)
          3. 类⽐:⾼考解题的举⼀反三能⼒
    1. 技术栈迭代图示解析

o

      • 训练侧 :
        1. 数据量↑ + 数据质量↑ → 模型原⽣能⼒↑
        2. 训练⽅法优化 → 训练效率↑
      • 应⽤侧 :
        1. 提示⼯程+ 知识库→ 响应质量
        2. 检索增强⽣成+ 函数调⽤ → Agent能⼒
  1. 构建Al Agent背后的核⼼理论 22:40
    1. ⼤模型能⼒提升的两个核⼼⽅向
      • 原⽣能⼒提升 : ⼤模型⾃⾝的能⼒在不断变强,主要体现在数据处理和理解能⼒的增强。
      • 对话效果提升 : ⼤模型的对话效果在⼤幅提升,能够更⾃然、准确地回应⽤户需求。
    2. ⼤模型技术栈迭代
      • 数据层⾯ : 数据量增加(Increased data volume)和数据质量提升(Improved data

quality)

      • ⽅法层⾯ : 训练⽅法增强(Enhanced training methods)和功能调⽤能⼒(Function

calling capability)

      • 涌现能⼒ : 包括Agent能⼒(Agent capability)和检索增强⽣成(Retrieval-Augmented

Generation)

    1. ⼤模型对话效果提升的挑战

o

      • 知识库更新不及时 : ⼤模型的知识获取仅限于预训练或微调阶段,⽆法实时更新。例如询问"今天的天⽓怎么样?"时⽆法提供实时数据。
      • ⼤模型幻觉问题 : 当⾯对不了解的问题时,⼤模型可能会产⽣不准确或虚构的回答。
    • 提示⼯程(Stage 1)

o

      • In-Conttextt Learning : 通过提供少量标注的"输⼊-输出对"示例,在不进⾏微调的情况下改善输出质量。
      • 应⽤示例 : 当询问天⽓时,先⼿动提供天⽓数据,再让模型基于这些数据⽣成回答。
      • 局限性 : 需要⼈⼯介⼊,⽆法实现完全⾃动化。
    • 函数调⽤(Stage 2)

o

      • ⾃主决策 : 模型能智能选择⼯具来回答问题,如⾃动调⽤天⽓API获取实时数据。
      • 可靠解析 : 响应采⽤JSON格式⽽⾮⾃然语⾔,便于程序处理。
      • 实现原理 : 提供⽤户定义的JSON字符串描述⼯具功能,模型⾃主判断是否需要调

⽤。

      • 应⽤优势 : 解决了知识库更新不及时问题,扩展了⼤模型的应⽤范围。
  1. Agent背后的AgentExecutor 40:09
    1. 函数调⽤的成熟应⽤

o

      • 技术成熟度 : 函数调⽤技术已趋于成熟,成为连接外部系统的标准⽅式。
      • 应⽤场景 : 可连接结构化API、本地数据库、⾃定义Python函数等。
      • 实际案例 : 询问天⽓时,模型⾃动搜索⽹站获取实时数据并⽣成回答。
    • 当前⾯临的挑战

o

      • 幻觉问题 : 当⾯对不了解的问题时,模型可能产⽣不准确回答。例如新员⼯询问公司注意事项时,模型会⽣成通⽤但可能不准确的建议。
      • 解决⽅案需求 : 需要进⼀步的技术迭代来解决幻觉问题,提升回答的准确性。

⼆、知识⼩结

|-----|------|------------|------|
| 知识点 | 核⼼内容 | 考试重点/易 混淆点 | 难度系数 |

|-----------------------------------------------------|-------------------------------------------------|----------------------------|------|
| ⼤模型原⽣能 | 通过预训练和微调 ⽅法(如 Transformer架构)从数据中学习知 识,直接回答⽤户 问题 | 原⽣能⼒与涌现能⼒的区别 | ★★★ |
| ⼤模型涌现能 | 基于已学知识举⼀反三(如函数调 ⽤、Agent能⼒) | 如何通过专项训练增强涌现 能⼒ | ★★★★ |
| 知识库更新问 | ⼤模型训练数据存在时效性局限(如示例中GPT-4知识 截⽌2023年10⽉) | 实时信息需依赖外部⼯具补充 | ★★ |
| 提示⼯程 In- Conttextt Learning | 通过输⼊输出示例引导模型⽣成未知领域回答(如天⽓ 查询案例) | 示例构造的精准性影响效果 | ★★★ |
| 函数调⽤ Functtion Calling | 模型⾃主决策调⽤外部API(如天⽓接⼝)并解析返回 数据⽣成回复 | JSON 结构解析与⼯具描述的关键性 | ★★★★ |
| 技术迭代阶段 | 从原⽣对话→提示 ⼯程→函数调⽤ →Agent开发的演 进路径 | 各阶段技术瓶颈与解决⽅案对⽐ | ★★★★ |
| 幻觉问题 | 模型⽣成与事实不符的内容(未在⽂ 本中展开) | 幻觉与知识缺失的区分 | ★★★★ |

相关推荐
互联圈运营观察几秒前
Google I/O 2026之外,声网搞定弱网通话难题
人工智能
落日屿星辰1 分钟前
ops-cv - 让计算机视觉“看得快“
人工智能·计算机视觉
数学建模导师2 分钟前
2026电工杯A题电—氢—氨”耦合系统完整版解答含论文!
大数据·人工智能·数学建模
GEO从入门到精通6 分钟前
GEO学习书籍或文章推荐哪本?
人工智能·学习
陌陌龙12 分钟前
Sub2API 源码技术分析与搭建教程:把 AI 订阅变成可管理的 API 网关
人工智能
老虎海子12 分钟前
从零入门 OpenAI Codex|登录、权限、终端、记忆配置全实操
人工智能·vscode·自然语言处理·chatgpt·个人开发·业界资讯
与芯同行12 分钟前
TP9243S与TP9311双芯片:AI语音产品从采集到回放的完整解决方案
人工智能
若兰幽竹17 分钟前
【大模型应用】抖音爆款视频深度分析系统:流水线式AI逆向拆解流量密码,精准预测播放量!
人工智能·python·音视频·抖音爆款分析
AI技术控17 分钟前
NeuroH-TGL 论文解读:面向脑疾病诊断的神经异质性引导时序图学习方法
人工智能·语言模型·自然语言处理·langchain·nlp
fuquxiaoguang18 分钟前
微软Maia 200的“算力经济学”:推理时代的专用芯片如何改写游戏规则
人工智能·microsoft