没有人知道“他妈的” 智能体到底是什么

本文首发自博客没有人知道"他妈的" 智能体到底是什么（译）

Agent 没有共识

硅谷对 Agent 热情高涨，OpenAI CEO Sam Altman 表示，Agent 今年将加入劳动力大军。微软 CEO Satya Nadella 预测 Agent 将取代某些知识性工作。Salesforce CEO Marc Benioff 则表示，Salesforce 的目标是通过公司各种"代理式（Agentic）服务"，成为"世界第一的数字劳动力提供商。

但似乎没有人能就 AI Agent 究竟是什么达成共识。

过去几年里，科技行业大胆宣称 AI Agent（这个最时髦的词）将改变一切。正如 OpenAI 的 ChatGPT 等 AI 聊天机器人为我们提供了获取信息的新方式一样，像 Altman 和 Nadella 这样的 CEO 们声称，Agent 将从根本上改变我们的工作方式。这或许没错，但这也取决于如何定义"Agent"，而这并非易事，就像其他与 AI 相关的术语（例如"多模态"、"通用人工智能"以及"AI"本身）一样，"Agent"和"Agentic"这两个词正在被稀释到几乎毫无意义的地步。

这使得 OpenAI、微软、Salesforce、亚马逊、谷歌以及无数其他围绕 Agent 构建整个产品线的公司处于尴尬境地。亚马逊的 Agent 不同于谷歌或任何其他供应商的 Agent，这正导致混淆，同时让用户很迷惑。

谷歌产品高级总监、前 GitHub Copilot 负责人 Ryan Salva 表示，他开始讨厌"Agent"这个词。"我认为我们行业过度使用 Agent 这个术语，以至于它几乎变得荒谬可笑"，Salva 在接受 TechCrunch 采访时说。"这是我特别反感的事情之一。"

Agent 定义的困境

Agent 定义的困境并非新鲜事。去年，前 TechCrunch 记者 Ron Miller 在文章《什么是 AI Agent？》中指出几乎每家构建 Agent 的公司都以不同的方式处理这项技术，这个问题最近变得更加严重了。

本周，OpenAI 发表了一篇博客文章，将 Agent 定义为"能够代表用户独立完成任务的自动化系统"。然而就在同一周，该公司发布的开发者文档却将 Agent 定义为"配备了指令和工具的 LLM（大语言模型）"。OpenAI 的 API 产品营销负责人 Leher Pathak 随后在 X 上的帖子中表示，她理解"助手"（assistants）和"Agent"这两个术语是可以互换的，这进一步搅浑了水。

与此同时，微软的博客试图区分 Agent 和 AI 助手，前者被微软称为"AI 驱动世界的新应用"，可以定制化以具备特定专业知识，而助手仅仅是帮助处理一般任务，比如起草邮件。

AI 实验室 Anthropic 更直接地谈到了 Agent 定义的大杂烩。在一篇博客文章building-effective-Agents中，Anthropic 表示，Agent "可以通过多种方式定义"，既包括"能够长时间独立运行的全自主系统"，也包括"遵循预定义工作流程的规范性实现"。

Salesforce 对 "Agent"的定义或许是范围最广的。据这家软件巨头称，"Agent 是一种无需人工干预即可理解并响应客户咨询的系统"。该公司的网站列出了六个不同的类别，从"简单反思型 Agent"到"基于效用的 Agent"。

为何如此混乱？

Agent 就像 AI 一样是一个模糊的概念，并且它们在不断发展。OpenAI、谷歌和 Perplexity 才刚刚开始推出他们认为是自家首批 Agent 的产品------OpenAI 的 Operator、谷歌的 Project Mariner 和 Perplexity 的购物 Agent------它们的功能各不相同，覆盖范围很广。

IDC 全球研究集团副总裁 Rich Villars 指出，科技公司在不严格遵守技术定义方面"有着悠久的历史，他们更关心在技术层面上想要实现什么，尤其是在快速发展的市场中。"

但根据 AI 学习平台 DeepLearning.ai 创始人 Andrew Ng 的说法，市场营销在很大程度上是罪魁祸首。"Agent 和 Agentic 工作流的概念曾经有其技术含义，但大约一年前，营销人员和一些大公司抓住了它们。"

德勤 AI 主管 Jim Rowan 表示，缺乏统一的 Agent 定义既是机遇也是挑战。一方面，这种模糊性带来了灵活性，让公司可以根据自身需求定制 Agent。另一方面，它可能导致"预期错位"以及难以衡量基于 Agent 的项目价值和 ROI（投资回报率）。"至少在一个组织内部，如果没有标准化的定义，就很难对绩效进行基准测试并确保结果的一致性，这可能导致对 Agent 应交付什么的解释各不相同，从而可能使项目目标和结果复杂化。最终，虽然灵活性可以推动创造性解决方案，但更标准化的理解将有助于企业更好地驾驭 AI Agent 并最大化其投资。"

不幸的是，行业似乎不太可能在短期内（甚至永远）围绕"Agent"的某一个定义达成一致。