没有人知道“他妈的” 智能体到底是什么

本文首发自博客 没有人知道"他妈的" 智能体到底是什么(译)

Agent 没有共识

硅谷对 Agent 热情高涨,OpenAI CEO Sam Altman 表示,Agent 今年将加入劳动力大军。微软 CEO Satya Nadella 预测 Agent 将取代某些知识性工作。Salesforce CEO Marc Benioff 则表示,Salesforce 的目标是通过公司各种"代理式(Agentic)服务",成为"世界第一的数字劳动力提供商

但似乎没有人能就 AI Agent 究竟是什么达成共识。

过去几年里,科技行业大胆宣称 AI Agent(这个最时髦的词)将改变一切。正如 OpenAI 的 ChatGPT 等 AI 聊天机器人为我们提供了获取信息的新方式一样,像 Altman 和 Nadella 这样的 CEO 们声称,Agent 将从根本上改变我们的工作方式。这或许没错,但这也取决于如何定义"Agent",而这并非易事,就像其他与 AI 相关的术语(例如"多模态"、"通用人工智能"以及"AI"本身)一样,"Agent"和"Agentic"这两个词正在被稀释到几乎毫无意义的地步。

这使得 OpenAI、微软、Salesforce、亚马逊、谷歌以及无数其他围绕 Agent 构建整个产品线的公司处于尴尬境地。亚马逊的 Agent 不同于谷歌或任何其他供应商的 Agent,这正导致混淆,同时让用户很迷惑。

谷歌产品高级总监、前 GitHub Copilot 负责人 Ryan Salva 表示,他开始讨厌"Agent"这个词。"我认为我们行业过度使用 Agent 这个术语,以至于它几乎变得荒谬可笑",Salva 在接受 TechCrunch 采访时说。"这是我特别反感的事情之一。"

Agent 定义的困境

Agent 定义的困境并非新鲜事。去年,前 TechCrunch 记者 Ron Miller 在文章《什么是 AI Agent?》中指出几乎每家构建 Agent 的公司都以不同的方式处理这项技术,这个问题最近变得更加严重了。

本周,OpenAI 发表了一篇博客文章,将 Agent 定义为"能够代表用户独立完成任务的自动化系统"。然而就在同一周,该公司发布的开发者文档却将 Agent 定义为"配备了指令和工具的 LLM(大语言模型)"。OpenAI 的 API 产品营销负责人 Leher Pathak 随后在 X 上的帖子中表示,她理解"助手"(assistants)和"Agent"这两个术语是可以互换的,这进一步搅浑了水。

与此同时,微软的博客试图区分 Agent 和 AI 助手,前者被微软称为"AI 驱动世界的新应用",可以定制化以具备特定专业知识,而助手仅仅是帮助处理一般任务,比如起草邮件。

AI 实验室 Anthropic 更直接地谈到了 Agent 定义的大杂烩。在一篇博客文章building-effective-Agents中,Anthropic 表示,Agent "可以通过多种方式定义",既包括"能够长时间独立运行的全自主系统",也包括"遵循预定义工作流程的规范性实现"。

Salesforce 对 "Agent"的定义或许是范围最广的。据这家软件巨头称,"Agent 是一种无需人工干预即可理解并响应客户咨询的系统"。该公司的网站列出了六个不同的类别,从"简单反思型 Agent"到"基于效用的 Agent"。

为何如此混乱?

Agent 就像 AI 一样是一个模糊的概念,并且它们在不断发展。OpenAI、谷歌和 Perplexity 才刚刚开始推出他们认为是自家首批 Agent 的产品------OpenAI 的 Operator谷歌的 Project MarinerPerplexity 的购物 Agent------它们的功能各不相同,覆盖范围很广。

IDC 全球研究集团副总裁 Rich Villars 指出,科技公司在不严格遵守技术定义方面"有着悠久的历史,他们更关心在技术层面上想要实现什么,尤其是在快速发展的市场中。"

但根据 AI 学习平台 DeepLearning.ai 创始人 Andrew Ng 的说法,市场营销在很大程度上是罪魁祸首。"Agent 和 Agentic 工作流的概念曾经有其技术含义,但大约一年前,营销人员和一些大公司抓住了它们。"

德勤 AI 主管 Jim Rowan 表示,缺乏统一的 Agent 定义既是机遇也是挑战。一方面,这种模糊性带来了灵活性,让公司可以根据自身需求定制 Agent。另一方面,它可能导致"预期错位"以及难以衡量基于 Agent 的项目价值和 ROI(投资回报率)。"至少在一个组织内部,如果没有标准化的定义,就很难对绩效进行基准测试并确保结果的一致性,这可能导致对 Agent 应交付什么的解释各不相同,从而可能使项目目标和结果复杂化。最终,虽然灵活性可以推动创造性解决方案,但更标准化的理解将有助于企业更好地驾驭 AI Agent 并最大化其投资。"

不幸的是,行业似乎不太可能在短期内(甚至永远)围绕"Agent"的某一个定义达成一致。

相关推荐
墨染天姬13 分钟前
【AI】端侧AIBOX可以部署哪些智能体
人工智能
AI成长日志17 分钟前
【Agentic RL】1.1 什么是Agentic RL:从传统RL到智能体学习
人工智能·学习·算法
2501_9481142429 分钟前
2026年大模型API聚合平台技术评测:企业级接入层的治理演进与星链4SAPI架构观察
大数据·人工智能·gpt·架构·claude
小小工匠31 分钟前
LLM - awesome-design-md 从 DESIGN.md 到“可对话的设计系统”:用纯文本驱动 AI 生成一致 UI 的新范式
人工智能·ui
黎阳之光1 小时前
黎阳之光:视频孪生领跑者,铸就中国数字科技全球竞争力
大数据·人工智能·算法·安全·数字孪生
小超同学你好1 小时前
面向 LLM 的程序设计 6:Tool Calling 的完整生命周期——从定义、决策、执行到观测回注
人工智能·语言模型
智星云算力1 小时前
本地GPU与租用GPU混合部署:混合算力架构搭建指南
人工智能·架构·gpu算力·智星云·gpu租用
jinanwuhuaguo1 小时前
截止到4月8日,OpenClaw 2026年4月更新深度解读剖析:从“能力回归”到“信任内建”的范式跃迁
android·开发语言·人工智能·深度学习·kotlin
xiaozhazha_1 小时前
效率提升80%:2026年AI CRM与ERP深度集成的架构设计与实现
人工智能
枫叶林FYL1 小时前
【自然语言处理 NLP】7.2.2 安全性评估与Constitutional AI
人工智能·自然语言处理