大模型应用开发第五讲:成熟度模型:从ChatGPT(L2)到未来自主Agent(L4)

大模型应用开发第五讲:成熟度模型:从ChatGPT(L2)到未来自主Agent(L4)

资料取自《大模型应用开发:动手做AI Agent 》

查看总目录:学习大纲

关于DeepSeek本地部署指南可以看下我之前写的文章:DeepSeek R1本地与线上满血版部署:超详细手把手指南


Agent成熟度模型详解:从「智能客服」到「科幻管家」

手机进化史类比AI Agent发展路径,结合书中技术框架梳理阶段特征


一、成熟度分级表(先看全局)

级别 名称 能力类比 典型特征 案例参考
L1 基础对话模型 功能机(只能打电话) 单轮问答,无上下文记忆 早期客服机器人
L2 ChatGPT级(初级Agent) 智能手机(装App扩展能力) 简单规划+调用单个工具 GPT-4联网版
L3 专业领域Agent 智能手表(健康监测) 多步骤决策+领域工具链协作 医疗诊断Agent
L4 自主Agent 科幻管家(贾维斯) 跨系统协作+动态学习+自我优化 电影《钢铁侠》AI

二、逐级拆解(含技术原理与案例)

▶ L2级:会查资料的「实习生」

核心特征

  • 有限规划:拆解简单任务(如"查天气→推荐穿搭")25
  • 单一工具:每次调用1个接口(如地图API)5
  • 线性执行:出错需人工修正(订单失败就卡住)6

生活案例:旅行清单助手

用户说:"下周末去杭州要带什么?"

1️⃣ 查杭州天气(调用天气API → 显示有雨)5

2️⃣ 生成清单:雨伞、薄外套 → 结束任务6
是 否 用户提问 调用天气API 是否下雨? 建议带伞 建议防晒用品

▲ 线性决策流程(第5章Function Calling示例)


▶ L3级:行业专家级的「部门主管」

技术突破

  • 多级规划:任务树分解(如看病→挂号→检查→开药)16
  • 工具链协作:连续调用多个系统(医保计算+药房库存查询)6
  • 异常处理:预算超支自动切换方案(如改用平价替代药)6

医疗Agent实战流程

1️⃣ 患者输入症状 → 拆解为挂号科室→检查项目→取药 1

2️⃣ 调用医院HIS系统查号源 → 推荐最近三甲医院 56

3️⃣ 检查报告解读 → 自动对比历史病例库 5

4️⃣ 开药时检测医保余额 → 不足时触发短信提醒 6
是 否 症状描述 分解就诊步骤 工具1:挂号系统 工具2:检查项库 工具3:医保计算器 生成就诊方案 患者确认? 执行预约 重新规划

▲ 多工具协作流程(第6章ReAct框架)


▶ L4级:全能型的「CEO助理」

质变特征(相比L3):

  • 动态学习:从用户反馈优化策略(如记住用户常选航空公司)4
  • 跨系统协同:同时调度物流+支付+供应链系统 6
  • 自主纠错:航班取消时自动改签+重订酒店+通知客户 46

案例:情人节鲜花危机救援

1️⃣ 感知异常 :物流系统报警 → 50%库存损毁6

2️⃣ 动态规划

▸ 查找备用供应商(调用3个鲜花平台API)

▸ 比价后锁定本地批发市场现货 6

3️⃣ 多线程执行

▸ 向批发商付款 → 调用企业支付接口

▸ 同步更新客户订单 → 发送延迟补偿券 6

4️⃣ 经验沉淀:将本次方案存入危机应对知识库 24
是 否 库存告警 自主启动应急预案 并行调用工具 供应商检索API 比价算法 物流调度系统 成本<预算? 全自动采购 发起人工审批

▲ L4自主决策流程(第6章Plan-and-Execute案例)


三、关键技术支撑(书中核心章节索引)

L2→L3跃迁关键

L3→L4跃迁关键


四、未来展望:L5级「数字生命」会远吗?

书中线索《大模型应用开发:动手做AI Agent 》附录A方向):

  • 具身智能: Agent控制实体机器人维修设备 4
  • 人机共生: AI实时学习用户习惯 → 下班前自动调节家中空调4
  • 社会协作: 物流Agent与交通Agent协商最优配送路线 4

科幻照进现实的时间表
2024-01-01 2025-01-01 2026-01-01 2027-01-01 2028-01-01 2029-01-01 2030-01-01 L3医疗Agent L4供应链Agent L5具身Agent 城市级Agent网络 当前阶段 未来5年 Agent进化路线预测

关键引用


目录:总目录

上篇文章:大模型应用开发第四讲:两大方向:增加上下文信息(知识) vs 提升行动力(微调或Agent技术)

下篇文章:大模型应用开发第六讲:目标:从被动响应到主动决策与执行


相关推荐
浩子coding2 分钟前
通过 Spring AI Alibaba 源码,看如何玩转 ReAct 智能体范式
人工智能·后端
卡梅德生物科技小能手4 分钟前
卡梅德生物科普CD124(IL-4Rα):2型免疫炎症的核心调控靶点
人工智能·经验分享·深度学习
垂钓的小鱼15 分钟前
TRIZ理论是什么?萃智引擎如何将它变为工程师的AI创新助手
人工智能·microsoft
咋吃都不胖lyh5 分钟前
DBSCAN(基于密度的空间聚类应用与噪声)算法
人工智能·机器学习
诸葛务农8 分钟前
涡喷式发烟机施放粉末状烟剂成烟面积的计算:烟剂材料特性的影响
人工智能
ken223220 分钟前
在 Libreoffice Calc中输入自定义表情字符时,需要保存之后,才能正常显示
学习
云烟成雨TD22 分钟前
Agent Scope Java 2.x 系列【10】技能(Skill)
java·人工智能·agent
GDAL24 分钟前
书签栏的 AI 转型:用 bge-small-zh-v1.5 重塑书签管理
人工智能·书签栏
zwenqiyu28 分钟前
P5283 [十二省联考 2019] 异或粽子题解
c++·学习·算法
青山如墨雨如画29 分钟前
【北邮-无线通信中的人工智能】物理层技术中AI的应用实践:基于KNN的调制识别(1)理论基础
人工智能·python·机器学习·matlab·jupyter