企业流程的智能体 AI 生命周期


引言

围绕 ChatGPT(广义上的生成式 AI)的讨论现已演变为智能体 AI。ChatGPT 主要是一个能生成文本响应的聊天机器人,而 AI 智能体则可以自主执行复杂任务,例如完成销售、规划行程、预订航班、预约承包商处理家务、订购披萨等。下图展示了智能体 AI 系统的演变过程。

图 1:智能体 AI 的演变

比尔・盖茨最近构想了一个未来,届时我们将拥有能够处理和响应自然语言并完成多项不同任务的 AI 智能体。盖茨以规划旅行为例:通常情况下,这需要你自己预订酒店、航班、餐厅等。但 AI 智能体能够利用对你偏好的了解,代表你预订和购买这些服务。

简而言之,AI 智能体之所以如此受欢迎,是因为原则上它们可以应用于当今任何手动执行的企业流程。

因此,我们基本上可以将所有流程智能化,从客户服务台到工业流程(例如暖通空调优化),甚至可以利用智能体构建基础软件、数据和机器学习工程管道。为了实现这一智能化过程,我们需要一个全新的整体学科,涵盖完整的智能体生命周期,包括:

  • 捕捉智能体用例需求

  • 设计智能体(良好的智能体层级结构是什么样的?适用的智能体技能和工具是什么?)

  • 在智能体平台上进行安全且可扩展的实施

  • 这些智能体的治理和维护。

在这一智能化过程中需要牢记的一些原则:

  • 人们往往倾向于将手动流程与智能体流程进行一对一映射。这是一种低效的映射方式。设计者应记住,例如,智能体不受人力资源流程的约束:) 因此,软件智能体可以做不同的事情,并且做事方式与人类不同。

  • 同时,就像从安全角度来看人类是链条中最薄弱的环节一样,单个智能体也可能破坏整个执行过程。而且,如果智能体失控,我们无法例外处理,也不知道该责怪谁、处罚谁、解雇谁等。因此,建议设计所有智能体时都要极其谨慎,同时配备日志记录、可观测性和负责任的 AI 防护措施。

接下来,我们将深入探讨这一智能化过程:第 2 节确定智能体生命周期及其不同阶段;第 3 节概述智能体 AI 平台的参考架构,以适应这些生命周期阶段;第 4 节介绍两个案例研究,将智能化过程应用于运行客户服务台(4.1 节)和执行数据平台管理(4.2 节),包括数据编目和数据工程管道。

智能体AI生命周期管理

构建和运行AI智能体所涉及的典型阶段如图2所示。

图2:智能体AI生命周期管理

首先,我们需要定义用例:这包括明确问题陈述、理解其业务背景、数据需求和可用性,以及为智能体AI解决方案设定明确目标,量化投资回报率(ROI)。

其次,我们需要一个包含推理模型/大语言模型(LLMs)、智能体和工具的市场------在实践中,临时定义智能体和构建企业工具集成并非有效方式:)

例如,智能体间(A2A)协议规定了"智能体卡片"(一份JSON文档)的概念,它相当于智能体的数字"名片"。其中包含以下关键信息:

身份:名称、描述、提供者信息。

服务端点:可访问A2A服务的URL。

A2A能力:支持的协议功能,如流式传输或推送通知。

认证:与智能体交互所需的认证方案(例如"Bearer""OAuth2")。

技能:智能体可执行的特定任务或功能列表(智能体技能对象),包括其ID、名称、描述、输入模式、输出模式和示例。

客户端智能体随后可通过解析相应的智能体卡片来发现远程智能体------以此确定远程智能体是否适合特定任务、如何构建针对其技能的请求,以及如何安全地与其通信。同理,模型上下文协议(MCP)为动态工具发现规定了类似机制。通过mcp:// URI,智能体可以解析并获取有关工具能力、需求和交互方法的全面元数据信息。

A2A和MCP均基于对智能体和工具的文本/自然语言描述。这种方式可能不够充分,我们需要一种更正式的、基于能力/约束的发现模型,以实现工具和智能体的精确且自动化发现。

第三,我们需要设计智能体逻辑(实现目标的计划)。在此,我们需要区分确定性智能体和自主性智能体------因为它们的设计和执行方式大不相同。对于确定性智能体,这主要需要在初始阶段(静态地)定义一个编排模式,其中包含预先确定的智能体/工具。相比之下,对于自主性智能体,这仅限于将用例目标作为提示传递给LLM/推理模型。然后,规划器会动态定义执行计划,并能够在过程中调整计划------本质上是基于内存中的观察结果对环境做出反应。

第四,我们需要考虑优化智能体的部署以进行推理。随着生成式AI的发展和LLM的庞大体量,人们曾重点关注将LLM优化/量化为小语言模型(SLMs)。但鉴于当今大多数智能体聚焦于企业工作流,这一方向的优先级似乎有所降低。我相信,一旦有更多智能体投入生产,成本优化和能效将重新成为关注焦点。因此,这一阶段包括主动思考如何优化智能体部署------甚至可以将它们部署在边缘设备上。

最后,我们来讨论治理层。说实话,没有这一层,任何智能体都无法在企业中投入生产------实际上也不应该被允许投入生产。一个恰当的例子是摩根大通首席信息安全官(CISO)广泛流传的一封信,其中强调了对安全且具韧性的智能体架构的需求。

随着OpenAI智能体SDK的发布,防护措施似乎也已成为智能体AI生态系统中的核心要素。

总体而言,端到端可观测性至关重要,不仅能用于解决智能体陷入停滞的情况,还能为智能体偏离预设流程时提供回滚策略。

简而言之,关键结论是:在生产环境中构建可靠且可信的智能体,远不止编写几行代码那么简单:)

智能体AI参考架构

图3展示了智能体AI平台的关键组件,这些组件用于支撑上一节中确定的生命周期阶段:

  • 智能体(及工具)市场

  • 规划器------推理层

  • 个性化层

  • 编排层

  • 可观测性层(包含日志记录、检查点等功能)

  • 集成层(与企业系统集成)

  • 共享内存层(长期和短期内存)

图3:智能体AI平台参考架构

给定一个用户任务后,我们会提示大语言模型(LLM)进行任务分解------这是与生成式AI的重叠之处。遗憾的是,这也意味着如今的智能体AI系统受限于大语言模型(LLMs)的推理能力。例如,对于提示词"生成一个定制化电子邮件营销活动,以在1个月内实现100万美元的销售额。相关产品及其性能指标可在[网址]获取。请连接CRM系统[集成项]以获取客户姓名、电子邮件地址和人口统计详情",GPT4的任务分解如图4所示:(分析产品)------(确定目标受众)------(创建定制化电子邮件营销活动)。

图4:营销活动的智能体AI执行流程

随后,大语言模型会监控执行过程/环境,并根据需要自主调整。在这个案例中,智能体意识到无法达成销售目标,于是自主添加了以下任务:(寻找替代产品)------(利用客户数据实现电子邮件个性化)------(执行A/B测试)。

这就需要一个个性化层。类似于将大语言模型微调为特定领域的大语言模型/小语言模型,我们认为,为了推动智能体在企业中的应用,需要针对企业特定场景(适用的用户角色和用例)对(通用)AI智能体进行定制/微调。

图5展示了基于用户角色对AI智能体进行微调的参考架构。

图5:基于用户角色的AI智能体微调

由于需要编排多个智能体,因此需要一个集成层来支持不同的智能体交互模式,例如智能体到智能体的API、提供供人类使用的输出的智能体API、人类触发AI智能体、人类在环的AI智能体到智能体交互等。这些集成模式需要得到底层智能体运维(AgentOps)平台的支持。

还需要指出的是,大多数用例都需要与企业系统(例如本案例中的CRM)集成。例如,MCP通过(动态地)将工具连接到存储企业数据的外部系统,实现了这一点。

鉴于此类复杂任务的长期运行特性,内存管理是智能体AI系统的关键。初始电子邮件营销活动启动后,智能体需要对该活动进行为期1个月的监控。

这既需要任务间的上下文共享,也需要长期维持执行上下文。

标准的做法是将智能体信息的嵌入表示存储到向量存储数据库中,该数据库需支持最大内积搜索(MIPS)。为了快速检索,会使用近似最近邻(ANN)算法,该算法返回近似的前k个最近邻,以一定的精度为代价换取极大的速度提升。

图6展示了智能体AI系统的综合内存管理,包括短期和长期内存模块。、

图6:智能体AI内存管理

智能化案例研究

4.1 客户服务台

在本节中,我们将展示如何利用AI智能体重构典型的客户服务台(如图7所示)------通过为终端用户提供更高效、更个性化的服务来创造业务价值。

图7:客户服务台的智能化

如今,在呼叫中心中,知识库(KB)文章/标准操作流程(SOP)定义了由人工坐席执行的系统化步骤流程。它本质上是一个预定义的流程,包含逐步说明,用于解决反复出现的客户问题。

图8:客户服务台的智能体AI平台参考架构

图8展示了适用于执行客户服务台特定任务的智能体AI平台参考架构(第3节中介绍)。用户交互和数据接口步骤均可通过增强了工具(脚本、API和UI/UX)的大语言模型(LLMs)实现自动化。

大语言模型可以为用户生成问题、解读用户输入、提取相关信息,并生成状态消息和确认信息。API可用于检索结构化和非结构化数据,而推理型大语言模型则能有效利用这些数据来制定决策/确定下一步行动。

知识库文章/SOP可被视为一个有向无环图(DAG),其中每个节点代表一个步骤,边代表从当前状态可能产生的分支(结果/下一步)。

我们假设存在一个供AI智能体使用的知识库文章仓库,其中每篇文章包含每个步骤的以下详细信息:

  • action_id:待执行步骤的动作标识符。

  • action_type:定义动作类型,例如api_call、get_user_input、retrieve_ext_knowledge。

  • action_metadata:对于get_user_input类型,包含期望从用户处获取的输入或需要传达给用户的消息;对于api_call类型,包含相应的API端点,以及调用所需的输入参数。

基于大语言模型的智能体随后可以自主执行知识库文章中的步骤。在这种情况下,相关的客户服务台智能体包括:

  • 客户智能体

  • 产品智能体

  • 服务等级协议(SLA)智能体

  • 个性化智能体

  • 负责任AI智能体

  • 音频(语音)智能体

  • 基于检索增强生成(RAG)的知识库检索智能体

  • (基于生成式AI的)邮件回复生成智能体

4.2 数据管理/数据工程

在本节中,我们将展示智能体AI如何应用于两个核心数据平台管理流程:数据编目和数据工程(数据仓库)------并概述与这两种场景相关的特定任务AI智能体。

图9展示了重构后的用于数据平台管理的智能化流程,其中包含关键任务:

  • 自动化数据管道(数据摄入、建模、转换),

  • 通过AI驱动的政策执行将治理和合规性落地实施;

  • 为实时业务决策提供洞察和预测。

图9:数据平台管理的智能化

图10展示了适用于执行数据平台管理的智能体AI平台参考架构。关键的数据编目智能体包括:

  • 主管智能体:扫描企业源系统以寻找新的相关数据------为智能体分配和调度任务。

  • 数据发现智能体:自主提取实体以检测关系并进行元数据增强。

  • 数据集成智能体:提供与ERP、CRM等企业系统的无缝集成,支持实时编目更新。

  • 元数据验证智能体:执行元数据一致性检查,检测重复数据,确保关系映射准确性。

  • 数据可观测性智能体:持续跟踪数据血缘,应用安全和访问控制策略,并确保合规性。

图10:用于数据管理的智能体AI平台

同理,关键的数据工程智能体包括:

  • 主管智能体:调度批处理和实时作业,自动化从批处理和流数据源的数据摄入。

  • ETL智能体提供数据管道的端到端自动化,包括数据摄入、建模和转换。

  • 数据质量智能体:执行数据质量、完整性和一致性检查,去除重复记录等。

  • 数据建模与调优智能体:基于schema漂移检测和用户查询趋势动态调整schema和索引------自动适配表结构。

  • 数据可观测性智能体:持续监控数据仓库性能,自动调优数据管道以提升速度和成本效率。

结论

智能体AI是一种强大的范式,有望颠覆当今企业中普遍存在的许多业务流程。在本文中,我们重点探讨了这一"智能化"过程。

这一智能化过程始于当今一种本质上需要大量人工干预的人工流程。随后,我们重新构想了底层流程,借助自主AI智能体实现了高度自动化。之后,我们识别并概述了与该过程相关的特定任务AI智能体。最后,我们提出了智能体AI平台的参考架构,该架构能够以个性化方式为终端用户编排已识别的智能体(层级结构)。

我们最后展示了两个应用智能化过程的案例研究:一个是实现IT流程------数据平台管理(包括数据编目和数据工程管道),另一个是优化客户服务台。我们认为,鉴于企业流程的不断演变特性,智能化有望创造显著的业务价值。

相关推荐
泉城老铁1 小时前
springboot+vue实现快速文件上传详细指南
vue.js·后端·架构
OpenBayes贝式计算2 小时前
OpenBayes 教程上新丨一句话精准P图,FLUX.1 Kontext可实现图像编辑/风格迁移/文本编辑/角色一致性编辑
人工智能·深度学习·机器学习
Java技术小馆2 小时前
5种禁止用户复制的实用方案
java·面试·架构
不甘打工的程序猿2 小时前
nacos通讯方式学习《gRPC》
前端·架构
墨尘游子3 小时前
一文读懂循环神经网络—从零实现长短期记忆网络(LSTM)
人工智能·python·深度学习·神经网络·算法·机器学习·lstm
文火冰糖的硅基工坊3 小时前
[硬件电路-28]:从简单到复杂:宇宙、芯片与虚拟世界的共通逻辑
科技·架构·信号处理·电路·跨学科融合
王小王-1234 小时前
基于深度学习的LSTM、GRU对大数据交通流量分析与预测的研究
深度学习·gru·lstm·交通流量预测系统·客流量预测系统·流量预测·拥堵预测
步行cgn4 小时前
B/S 架构通信原理详解
架构
前端付豪4 小时前
24、前端性能优化体系:从指标定义到监控闭环的实战指南
前端·javascript·架构
纪伊路上盛名在5 小时前
(鱼书)深度学习入门3:手搓神经网络
人工智能·深度学习·神经网络·机器学习