企业流程的智能体 AI 生命周期

引言

围绕 ChatGPT（广义上的生成式 AI）的讨论现已演变为智能体 AI。ChatGPT 主要是一个能生成文本响应的聊天机器人，而 AI 智能体则可以自主执行复杂任务，例如完成销售、规划行程、预订航班、预约承包商处理家务、订购披萨等。下图展示了智能体 AI 系统的演变过程。

图 1：智能体 AI 的演变

比尔・盖茨最近构想了一个未来，届时我们将拥有能够处理和响应自然语言并完成多项不同任务的 AI 智能体。盖茨以规划旅行为例：通常情况下，这需要你自己预订酒店、航班、餐厅等。但 AI 智能体能够利用对你偏好的了解，代表你预订和购买这些服务。

简而言之，AI 智能体之所以如此受欢迎，是因为原则上它们可以应用于当今任何手动执行的企业流程。

因此，我们基本上可以将所有流程智能化，从客户服务台到工业流程（例如暖通空调优化），甚至可以利用智能体构建基础软件、数据和机器学习工程管道。为了实现这一智能化过程，我们需要一个全新的整体学科，涵盖完整的智能体生命周期，包括：

捕捉智能体用例需求
设计智能体（良好的智能体层级结构是什么样的？适用的智能体技能和工具是什么？）
在智能体平台上进行安全且可扩展的实施
这些智能体的治理和维护。

在这一智能化过程中需要牢记的一些原则：

人们往往倾向于将手动流程与智能体流程进行一对一映射。这是一种低效的映射方式。设计者应记住，例如，智能体不受人力资源流程的约束：) 因此，软件智能体可以做不同的事情，并且做事方式与人类不同。
同时，就像从安全角度来看人类是链条中最薄弱的环节一样，单个智能体也可能破坏整个执行过程。而且，如果智能体失控，我们无法例外处理，也不知道该责怪谁、处罚谁、解雇谁等。因此，建议设计所有智能体时都要极其谨慎，同时配备日志记录、可观测性和负责任的 AI 防护措施。

接下来，我们将深入探讨这一智能化过程：第 2 节确定智能体生命周期及其不同阶段；第 3 节概述智能体 AI 平台的参考架构，以适应这些生命周期阶段；第 4 节介绍两个案例研究，将智能化过程应用于运行客户服务台（4.1 节）和执行数据平台管理（4.2 节），包括数据编目和数据工程管道。

智能体AI生命周期管理

构建和运行AI智能体所涉及的典型阶段如图2所示。

图2：智能体AI生命周期管理

首先，我们需要定义用例：这包括明确问题陈述、理解其业务背景、数据需求和可用性，以及为智能体AI解决方案设定明确目标，量化投资回报率（ROI）。

其次，我们需要一个包含推理模型/大语言模型（LLMs）、智能体和工具的市场------在实践中，临时定义智能体和构建企业工具集成并非有效方式:)

例如，智能体间（A2A）协议规定了"智能体卡片"（一份JSON文档）的概念，它相当于智能体的数字"名片"。其中包含以下关键信息：

身份：名称、描述、提供者信息。

服务端点：可访问A2A服务的URL。

A2A能力：支持的协议功能，如流式传输或推送通知。

认证：与智能体交互所需的认证方案（例如"Bearer""OAuth2"）。

技能：智能体可执行的特定任务或功能列表（智能体技能对象），包括其ID、名称、描述、输入模式、输出模式和示例。

客户端智能体随后可通过解析相应的智能体卡片来发现远程智能体------以此确定远程智能体是否适合特定任务、如何构建针对其技能的请求，以及如何安全地与其通信。同理，模型上下文协议（MCP）为动态工具发现规定了类似机制。通过mcp:// URI，智能体可以解析并获取有关工具能力、需求和交互方法的全面元数据信息。

A2A和MCP均基于对智能体和工具的文本/自然语言描述。这种方式可能不够充分，我们需要一种更正式的、基于能力/约束的发现模型，以实现工具和智能体的精确且自动化发现。

第三，我们需要设计智能体逻辑（实现目标的计划）。在此，我们需要区分确定性智能体和自主性智能体------因为它们的设计和执行方式大不相同。对于确定性智能体，这主要需要在初始阶段（静态地）定义一个编排模式，其中包含预先确定的智能体/工具。相比之下，对于自主性智能体，这仅限于将用例目标作为提示传递给LLM/推理模型。然后，规划器会动态定义执行计划，并能够在过程中调整计划------本质上是基于内存中的观察结果对环境做出反应。

第四，我们需要考虑优化智能体的部署以进行推理。随着生成式AI的发展和LLM的庞大体量，人们曾重点关注将LLM优化/量化为小语言模型（SLMs）。但鉴于当今大多数智能体聚焦于企业工作流，这一方向的优先级似乎有所降低。我相信，一旦有更多智能体投入生产，成本优化和能效将重新成为关注焦点。因此，这一阶段包括主动思考如何优化智能体部署------甚至可以将它们部署在边缘设备上。

最后，我们来讨论治理层。说实话，没有这一层，任何智能体都无法在企业中投入生产------实际上也不应该被允许投入生产。一个恰当的例子是摩根大通首席信息安全官（CISO）广泛流传的一封信，其中强调了对安全且具韧性的智能体架构的需求。

随着OpenAI智能体SDK的发布，防护措施似乎也已成为智能体AI生态系统中的核心要素。

总体而言，端到端可观测性至关重要，不仅能用于解决智能体陷入停滞的情况，还能为智能体偏离预设流程时提供回滚策略。

简而言之，关键结论是：在生产环境中构建可靠且可信的智能体，远不止编写几行代码那么简单:)

智能体AI参考架构

图3展示了智能体AI平台的关键组件，这些组件用于支撑上一节中确定的生命周期阶段：

智能体（及工具）市场
规划器------推理层
个性化层
编排层
可观测性层（包含日志记录、检查点等功能）
集成层（与企业系统集成）
共享内存层（长期和短期内存）

图3：智能体AI平台参考架构

给定一个用户任务后，我们会提示大语言模型（LLM）进行任务分解------这是与生成式AI的重叠之处。遗憾的是，这也意味着如今的智能体AI系统受限于大语言模型（LLMs）的推理能力。例如，对于提示词"生成一个定制化电子邮件营销活动，以在1个月内实现100万美元的销售额。相关产品及其性能指标可在[网址]获取。请连接CRM系统[集成项]以获取客户姓名、电子邮件地址和人口统计详情"，GPT4的任务分解如图4所示：（分析产品）------（确定目标受众）------（创建定制化电子邮件营销活动）。

图4：营销活动的智能体AI执行流程

随后，大语言模型会监控执行过程/环境，并根据需要自主调整。在这个案例中，智能体意识到无法达成销售目标，于是自主添加了以下任务：（寻找替代产品）------（利用客户数据实现电子邮件个性化）------（执行A/B测试）。

这就需要一个个性化层。类似于将大语言模型微调为特定领域的大语言模型/小语言模型，我们认为，为了推动智能体在企业中的应用，需要针对企业特定场景（适用的用户角色和用例）对（通用）AI智能体进行定制/微调。

图5展示了基于用户角色对AI智能体进行微调的参考架构。

图5：基于用户角色的AI智能体微调

由于需要编排多个智能体，因此需要一个集成层来支持不同的智能体交互模式，例如智能体到智能体的API、提供供人类使用的输出的智能体API、人类触发AI智能体、人类在环的AI智能体到智能体交互等。这些集成模式需要得到底层智能体运维（AgentOps）平台的支持。

还需要指出的是，大多数用例都需要与企业系统（例如本案例中的CRM）集成。例如，MCP通过（动态地）将工具连接到存储企业数据的外部系统，实现了这一点。

鉴于此类复杂任务的长期运行特性，内存管理是智能体AI系统的关键。初始电子邮件营销活动启动后，智能体需要对该活动进行为期1个月的监控。

这既需要任务间的上下文共享，也需要长期维持执行上下文。

标准的做法是将智能体信息的嵌入表示存储到向量存储数据库中，该数据库需支持最大内积搜索（MIPS）。为了快速检索，会使用近似最近邻（ANN）算法，该算法返回近似的前k个最近邻，以一定的精度为代价换取极大的速度提升。

图6展示了智能体AI系统的综合内存管理，包括短期和长期内存模块。、

图6：智能体AI内存管理

智能化案例研究

4.1 客户服务台

在本节中，我们将展示如何利用AI智能体重构典型的客户服务台（如图7所示）------通过为终端用户提供更高效、更个性化的服务来创造业务价值。

图7：客户服务台的智能化

如今，在呼叫中心中，知识库（KB）文章/标准操作流程（SOP）定义了由人工坐席执行的系统化步骤流程。它本质上是一个预定义的流程，包含逐步说明，用于解决反复出现的客户问题。

图8：客户服务台的智能体AI平台参考架构

图8展示了适用于执行客户服务台特定任务的智能体AI平台参考架构（第3节中介绍）。用户交互和数据接口步骤均可通过增强了工具（脚本、API和UI/UX）的大语言模型（LLMs）实现自动化。

大语言模型可以为用户生成问题、解读用户输入、提取相关信息，并生成状态消息和确认信息。API可用于检索结构化和非结构化数据，而推理型大语言模型则能有效利用这些数据来制定决策/确定下一步行动。

知识库文章/SOP可被视为一个有向无环图（DAG），其中每个节点代表一个步骤，边代表从当前状态可能产生的分支（结果/下一步）。

我们假设存在一个供AI智能体使用的知识库文章仓库，其中每篇文章包含每个步骤的以下详细信息：

action_id：待执行步骤的动作标识符。
action_type：定义动作类型，例如api_call、get_user_input、retrieve_ext_knowledge。
action_metadata：对于get_user_input类型，包含期望从用户处获取的输入或需要传达给用户的消息；对于api_call类型，包含相应的API端点，以及调用所需的输入参数。

基于大语言模型的智能体随后可以自主执行知识库文章中的步骤。在这种情况下，相关的客户服务台智能体包括：

客户智能体
产品智能体
服务等级协议（SLA）智能体
个性化智能体
负责任AI智能体
音频（语音）智能体
基于检索增强生成（RAG）的知识库检索智能体
（基于生成式AI的）邮件回复生成智能体

4.2 数据管理/数据工程

在本节中，我们将展示智能体AI如何应用于两个核心数据平台管理流程：数据编目和数据工程（数据仓库）------并概述与这两种场景相关的特定任务AI智能体。

图9展示了重构后的用于数据平台管理的智能化流程，其中包含关键任务：

自动化数据管道（数据摄入、建模、转换），
通过AI驱动的政策执行将治理和合规性落地实施；
为实时业务决策提供洞察和预测。

图9：数据平台管理的智能化

图10展示了适用于执行数据平台管理的智能体AI平台参考架构。关键的数据编目智能体包括：

主管智能体：扫描企业源系统以寻找新的相关数据------为智能体分配和调度任务。
数据发现智能体：自主提取实体以检测关系并进行元数据增强。
数据集成智能体：提供与ERP、CRM等企业系统的无缝集成，支持实时编目更新。
元数据验证智能体：执行元数据一致性检查，检测重复数据，确保关系映射准确性。
数据可观测性智能体：持续跟踪数据血缘，应用安全和访问控制策略，并确保合规性。

图10：用于数据管理的智能体AI平台

同理，关键的数据工程智能体包括：

主管智能体：调度批处理和实时作业，自动化从批处理和流数据源的数据摄入。
ETL智能体提供数据管道的端到端自动化，包括数据摄入、建模和转换。
数据质量智能体：执行数据质量、完整性和一致性检查，去除重复记录等。
数据建模与调优智能体：基于schema漂移检测和用户查询趋势动态调整schema和索引------自动适配表结构。
数据可观测性智能体：持续监控数据仓库性能，自动调优数据管道以提升速度和成本效率。

结论

智能体AI是一种强大的范式，有望颠覆当今企业中普遍存在的许多业务流程。在本文中，我们重点探讨了这一"智能化"过程。

这一智能化过程始于当今一种本质上需要大量人工干预的人工流程。随后，我们重新构想了底层流程，借助自主AI智能体实现了高度自动化。之后，我们识别并概述了与该过程相关的特定任务AI智能体。最后，我们提出了智能体AI平台的参考架构，该架构能够以个性化方式为终端用户编排已识别的智能体（层级结构）。

我们最后展示了两个应用智能化过程的案例研究：一个是实现IT流程------数据平台管理（包括数据编目和数据工程管道），另一个是优化客户服务台。我们认为，鉴于企业流程的不断演变特性，智能化有望创造显著的业务价值。