大模型应用发展与Agent前沿技术趋势

⼀、⼤模型与 Agent 开发

  1. ⼤模型应⽤发展与Agent前沿技术趋势
  1. ⼤模型应⽤的技术迭代过程 03:33
    1. ⼤模型的发展历程

o

      • 技术萌芽期 :2022年底国外已开始激烈讨论⼤模型技术,国内认知普及始于2023

年ChatGPT问世

      • 现象级突破 :ChatGPT作为对话式应⽤改变了⼈们对智能应⽤的认知,从机械式应答跃升⾄拟⼈化交互
      • 技术对⽐ :传统智能客服(京东/淘宝)存在机械回答、频繁出错的特点,⽽⼤模型实现了⾃然语⾔理解与即时响应
    • 技术跨越特征

o

      • 交互⾰命 :突破传统机器学习模型需特定训练数据的限制(如分类任务/NER),实现跨领域问题解决
      • 情感理解 :示例中GPT-4能识别"⼼情不好"的情绪状态,提供情感⽀持和建议(领导批评场景)
      • ⻆⾊切换 :通过新建对话窗⼝即可实现不同⻆⾊扮演,体现单⼀模型的多元应⽤能⼒
    • ⾏业影响

o

      • ⾏业⾥程碑 :2023年被公认为"⼤模型元年",标志着⼈⼯智能进⼊新阶段
      • 能⼒边界 :单个模型可处理语⾔理解、情感分析、知识问答等多模态任务
      • 技术颠覆 :相⽐传统模型(需定制开发),⼤模型展现出"样样通"的通⽤智能特性
  1. AI Agent应⽤爆发的根本原因 08:55
    1. ⼤模型的技术跨越

o

      • ⻆⾊切换能⼒ : 只需新建对话窗⼝即可化⾝全新伙伴,实现多⻆⾊⽆缝切换
      • 技术突破性 : 突破传统AI需要特定数据训练的限制,直接解决各类问题
      • ⾏业影响 : 将2023年确⽴为"⼤模型元年",标志着AI技术迈上新台阶
    • ⽤户感知与技术实质的差异

o

      • ⽤户视⻆ :
        1. 界⾯美观度提升
        2. 功能增量:图⽚/⽂件上传、插件构建等
        3. 产品形态保持对话式核⼼不变
      • 技术本质 :
        1. 迭代速度远超其他领域
        2. 国内应⽤(如Kimi、⾖包)均保持对话核⼼
        3. 降低AI使⽤⻔槛:⽆需部署训练即可处理多任务
    • 技术发展的核⼼⽅向
      • 模型能⼒增强
        1. &bsp;数据维度 :
          1. 数据量增⻓ : 可⽤训练数据持续增加(如GPT版本迭代中的数据集扩展)
          2. 数据质量提升 : 通过模型表现反馈优化数据筛选标准(如GPT-3到GPT-4的数据清洗改进)
        2. &bsp;训练⽅法 :
          1. 从传统微调(Fine-tuning)到⾼效适配(如LoRA)
          2. 训练效率提升:同量数据下模型吸收能⼒增强
      1. 对话效果提升
        1. &bsp;原⽣能⼒ :
          1. 基于Transformer架构的预训练知识存储
          2. 类⽐:如⾼中⽣掌握学科知识后可直接解题
        2. &bsp;涌现能⼒ :
          1. 函数调⽤( Functtion Calling : 外部⼯具调⽤准确率提升(早期需详细描述,现可模糊匹配)
          2. Agentt 能⼒ : 专项训练实现的复杂任务处理能⼒(本课程核⼼内容)
          3. 类⽐:⾼考解题的举⼀反三能⼒
    1. 技术栈迭代图示解析

o

      • 训练侧 :
        1. 数据量↑ + 数据质量↑ → 模型原⽣能⼒↑
        2. 训练⽅法优化 → 训练效率↑
      • 应⽤侧 :
        1. 提示⼯程+ 知识库→ 响应质量
        2. 检索增强⽣成+ 函数调⽤ → Agent能⼒
  1. 构建Al Agent背后的核⼼理论 22:40
    1. ⼤模型能⼒提升的两个核⼼⽅向
      • 原⽣能⼒提升 : ⼤模型⾃⾝的能⼒在不断变强,主要体现在数据处理和理解能⼒的增强。
      • 对话效果提升 : ⼤模型的对话效果在⼤幅提升,能够更⾃然、准确地回应⽤户需求。
    2. ⼤模型技术栈迭代
      • 数据层⾯ : 数据量增加(Increased data volume)和数据质量提升(Improved data

quality)

      • ⽅法层⾯ : 训练⽅法增强(Enhanced training methods)和功能调⽤能⼒(Function

calling capability)

      • 涌现能⼒ : 包括Agent能⼒(Agent capability)和检索增强⽣成(Retrieval-Augmented

Generation)

    1. ⼤模型对话效果提升的挑战

o

      • 知识库更新不及时 : ⼤模型的知识获取仅限于预训练或微调阶段,⽆法实时更新。例如询问"今天的天⽓怎么样?"时⽆法提供实时数据。
      • ⼤模型幻觉问题 : 当⾯对不了解的问题时,⼤模型可能会产⽣不准确或虚构的回答。
    • 提示⼯程(Stage 1)

o

      • In-Conttextt Learning : 通过提供少量标注的"输⼊-输出对"示例,在不进⾏微调的情况下改善输出质量。
      • 应⽤示例 : 当询问天⽓时,先⼿动提供天⽓数据,再让模型基于这些数据⽣成回答。
      • 局限性 : 需要⼈⼯介⼊,⽆法实现完全⾃动化。
    • 函数调⽤(Stage 2)

o

      • ⾃主决策 : 模型能智能选择⼯具来回答问题,如⾃动调⽤天⽓API获取实时数据。
      • 可靠解析 : 响应采⽤JSON格式⽽⾮⾃然语⾔,便于程序处理。
      • 实现原理 : 提供⽤户定义的JSON字符串描述⼯具功能,模型⾃主判断是否需要调

⽤。

      • 应⽤优势 : 解决了知识库更新不及时问题,扩展了⼤模型的应⽤范围。
  1. Agent背后的AgentExecutor 40:09
    1. 函数调⽤的成熟应⽤

o

      • 技术成熟度 : 函数调⽤技术已趋于成熟,成为连接外部系统的标准⽅式。
      • 应⽤场景 : 可连接结构化API、本地数据库、⾃定义Python函数等。
      • 实际案例 : 询问天⽓时,模型⾃动搜索⽹站获取实时数据并⽣成回答。
    • 当前⾯临的挑战

o

      • 幻觉问题 : 当⾯对不了解的问题时,模型可能产⽣不准确回答。例如新员⼯询问公司注意事项时,模型会⽣成通⽤但可能不准确的建议。
      • 解决⽅案需求 : 需要进⼀步的技术迭代来解决幻觉问题,提升回答的准确性。

⼆、知识⼩结

|-----|------|------------|------|
| 知识点 | 核⼼内容 | 考试重点/易 混淆点 | 难度系数 |

|-----------------------------------------------------|-------------------------------------------------|----------------------------|------|
| ⼤模型原⽣能 | 通过预训练和微调 ⽅法(如 Transformer架构)从数据中学习知 识,直接回答⽤户 问题 | 原⽣能⼒与涌现能⼒的区别 | ★★★ |
| ⼤模型涌现能 | 基于已学知识举⼀反三(如函数调 ⽤、Agent能⼒) | 如何通过专项训练增强涌现 能⼒ | ★★★★ |
| 知识库更新问 | ⼤模型训练数据存在时效性局限(如示例中GPT-4知识 截⽌2023年10⽉) | 实时信息需依赖外部⼯具补充 | ★★ |
| 提示⼯程 In- Conttextt Learning | 通过输⼊输出示例引导模型⽣成未知领域回答(如天⽓ 查询案例) | 示例构造的精准性影响效果 | ★★★ |
| 函数调⽤ Functtion Calling | 模型⾃主决策调⽤外部API(如天⽓接⼝)并解析返回 数据⽣成回复 | JSON 结构解析与⼯具描述的关键性 | ★★★★ |
| 技术迭代阶段 | 从原⽣对话→提示 ⼯程→函数调⽤ →Agent开发的演 进路径 | 各阶段技术瓶颈与解决⽅案对⽐ | ★★★★ |
| 幻觉问题 | 模型⽣成与事实不符的内容(未在⽂ 本中展开) | 幻觉与知识缺失的区分 | ★★★★ |

相关推荐
小程故事多_801 小时前
Kthena 引爆云原生推理革命:K8s 分布式架构破解 LLM 编排困局,吞吐狂飙 273%
人工智能·分布式·云原生·kubernetes·aigc
csuzhucong1 小时前
4种棋盘魔方(三A、三B、五A、五B)
人工智能
腾飞开源1 小时前
05_Spring AI 干货笔记之 Advisors API
人工智能·可观测性·检索增强生成·spring ai·advisors api·对话记忆·提示词增强
飞哥数智坊1 小时前
告别繁琐部署:TRAE SOLO 帮我一键跑通 Z-Image 模型
人工智能·trae·solo
学历真的很重要1 小时前
Hello-Agents —— 03大语言模型基础 通俗总结
开发语言·人工智能·后端·语言模型·自然语言处理·面试·langchain
OpenCSG3 小时前
OpenCSG 2025年11月月报:智能体平台、AI技术合作与开源生态进展
人工智能·开源·opencsg·csghub
围炉聊科技3 小时前
当AI成为“大脑”:人类如何在机器时代找到不可替代的价值?
人工智能
لا معنى له3 小时前
残差网络论文学习笔记:Deep Residual Learning for Image Recognition全文翻译
网络·人工智能·笔记·深度学习·学习·机器学习
菜只因C3 小时前
深度学习:从技术本质到未来图景的全面解析
人工智能·深度学习