没有人知道“他妈的” 智能体到底是什么

本文首发自博客 没有人知道"他妈的" 智能体到底是什么(译)

Agent 没有共识

硅谷对 Agent 热情高涨,OpenAI CEO Sam Altman 表示,Agent 今年将加入劳动力大军。微软 CEO Satya Nadella 预测 Agent 将取代某些知识性工作。Salesforce CEO Marc Benioff 则表示,Salesforce 的目标是通过公司各种"代理式(Agentic)服务",成为"世界第一的数字劳动力提供商

但似乎没有人能就 AI Agent 究竟是什么达成共识。

过去几年里,科技行业大胆宣称 AI Agent(这个最时髦的词)将改变一切。正如 OpenAI 的 ChatGPT 等 AI 聊天机器人为我们提供了获取信息的新方式一样,像 Altman 和 Nadella 这样的 CEO 们声称,Agent 将从根本上改变我们的工作方式。这或许没错,但这也取决于如何定义"Agent",而这并非易事,就像其他与 AI 相关的术语(例如"多模态"、"通用人工智能"以及"AI"本身)一样,"Agent"和"Agentic"这两个词正在被稀释到几乎毫无意义的地步。

这使得 OpenAI、微软、Salesforce、亚马逊、谷歌以及无数其他围绕 Agent 构建整个产品线的公司处于尴尬境地。亚马逊的 Agent 不同于谷歌或任何其他供应商的 Agent,这正导致混淆,同时让用户很迷惑。

谷歌产品高级总监、前 GitHub Copilot 负责人 Ryan Salva 表示,他开始讨厌"Agent"这个词。"我认为我们行业过度使用 Agent 这个术语,以至于它几乎变得荒谬可笑",Salva 在接受 TechCrunch 采访时说。"这是我特别反感的事情之一。"

Agent 定义的困境

Agent 定义的困境并非新鲜事。去年,前 TechCrunch 记者 Ron Miller 在文章《什么是 AI Agent?》中指出几乎每家构建 Agent 的公司都以不同的方式处理这项技术,这个问题最近变得更加严重了。

本周,OpenAI 发表了一篇博客文章,将 Agent 定义为"能够代表用户独立完成任务的自动化系统"。然而就在同一周,该公司发布的开发者文档却将 Agent 定义为"配备了指令和工具的 LLM(大语言模型)"。OpenAI 的 API 产品营销负责人 Leher Pathak 随后在 X 上的帖子中表示,她理解"助手"(assistants)和"Agent"这两个术语是可以互换的,这进一步搅浑了水。

与此同时,微软的博客试图区分 Agent 和 AI 助手,前者被微软称为"AI 驱动世界的新应用",可以定制化以具备特定专业知识,而助手仅仅是帮助处理一般任务,比如起草邮件。

AI 实验室 Anthropic 更直接地谈到了 Agent 定义的大杂烩。在一篇博客文章building-effective-Agents中,Anthropic 表示,Agent "可以通过多种方式定义",既包括"能够长时间独立运行的全自主系统",也包括"遵循预定义工作流程的规范性实现"。

Salesforce 对 "Agent"的定义或许是范围最广的。据这家软件巨头称,"Agent 是一种无需人工干预即可理解并响应客户咨询的系统"。该公司的网站列出了六个不同的类别,从"简单反思型 Agent"到"基于效用的 Agent"。

为何如此混乱?

Agent 就像 AI 一样是一个模糊的概念,并且它们在不断发展。OpenAI、谷歌和 Perplexity 才刚刚开始推出他们认为是自家首批 Agent 的产品------OpenAI 的 Operator谷歌的 Project MarinerPerplexity 的购物 Agent------它们的功能各不相同,覆盖范围很广。

IDC 全球研究集团副总裁 Rich Villars 指出,科技公司在不严格遵守技术定义方面"有着悠久的历史,他们更关心在技术层面上想要实现什么,尤其是在快速发展的市场中。"

但根据 AI 学习平台 DeepLearning.ai 创始人 Andrew Ng 的说法,市场营销在很大程度上是罪魁祸首。"Agent 和 Agentic 工作流的概念曾经有其技术含义,但大约一年前,营销人员和一些大公司抓住了它们。"

德勤 AI 主管 Jim Rowan 表示,缺乏统一的 Agent 定义既是机遇也是挑战。一方面,这种模糊性带来了灵活性,让公司可以根据自身需求定制 Agent。另一方面,它可能导致"预期错位"以及难以衡量基于 Agent 的项目价值和 ROI(投资回报率)。"至少在一个组织内部,如果没有标准化的定义,就很难对绩效进行基准测试并确保结果的一致性,这可能导致对 Agent 应交付什么的解释各不相同,从而可能使项目目标和结果复杂化。最终,虽然灵活性可以推动创造性解决方案,但更标准化的理解将有助于企业更好地驾驭 AI Agent 并最大化其投资。"

不幸的是,行业似乎不太可能在短期内(甚至永远)围绕"Agent"的某一个定义达成一致。

相关推荐
XIAO·宝31 分钟前
深度学习------专题《图像处理项目》终!
人工智能·深度学习
Nautiluss1 小时前
WIN7下安装RTX3050 6GB显卡驱动
人工智能·驱动开发·opencv
wwww.bo2 小时前
深度学习(5)完整版
人工智能·深度学习
yourkin6663 小时前
什么是神经网络?
人工智能·深度学习·神经网络
嘀咕博客3 小时前
Frames:Runway推出的AI图像生成模型,提供前所未有的风格控制和视觉一致性
人工智能·ai工具
isNotNullX4 小时前
ETL详解:从核心流程到典型应用场景
大数据·数据仓库·人工智能·架构·etl
科技峰行者4 小时前
通义万相2.5系列模型发布,可生成音画同步视频
人工智能·阿里云·ai·大模型·agi
Vizio<4 小时前
《面向物理交互任务的触觉传感阵列仿真》2020AIM论文解读
论文阅读·人工智能·机器人·机器人触觉
尤超宇5 小时前
基于卷积神经网络的 CIFAR-10 图像分类实验报告
人工智能·分类·cnn
alex1005 小时前
BeaverTails数据集:大模型安全对齐的关键资源与实战应用
人工智能·算法·安全