没有人知道“他妈的” 智能体到底是什么

本文首发自博客 没有人知道"他妈的" 智能体到底是什么(译)

Agent 没有共识

硅谷对 Agent 热情高涨,OpenAI CEO Sam Altman 表示,Agent 今年将加入劳动力大军。微软 CEO Satya Nadella 预测 Agent 将取代某些知识性工作。Salesforce CEO Marc Benioff 则表示,Salesforce 的目标是通过公司各种"代理式(Agentic)服务",成为"世界第一的数字劳动力提供商

但似乎没有人能就 AI Agent 究竟是什么达成共识。

过去几年里,科技行业大胆宣称 AI Agent(这个最时髦的词)将改变一切。正如 OpenAI 的 ChatGPT 等 AI 聊天机器人为我们提供了获取信息的新方式一样,像 Altman 和 Nadella 这样的 CEO 们声称,Agent 将从根本上改变我们的工作方式。这或许没错,但这也取决于如何定义"Agent",而这并非易事,就像其他与 AI 相关的术语(例如"多模态"、"通用人工智能"以及"AI"本身)一样,"Agent"和"Agentic"这两个词正在被稀释到几乎毫无意义的地步。

这使得 OpenAI、微软、Salesforce、亚马逊、谷歌以及无数其他围绕 Agent 构建整个产品线的公司处于尴尬境地。亚马逊的 Agent 不同于谷歌或任何其他供应商的 Agent,这正导致混淆,同时让用户很迷惑。

谷歌产品高级总监、前 GitHub Copilot 负责人 Ryan Salva 表示,他开始讨厌"Agent"这个词。"我认为我们行业过度使用 Agent 这个术语,以至于它几乎变得荒谬可笑",Salva 在接受 TechCrunch 采访时说。"这是我特别反感的事情之一。"

Agent 定义的困境

Agent 定义的困境并非新鲜事。去年,前 TechCrunch 记者 Ron Miller 在文章《什么是 AI Agent?》中指出几乎每家构建 Agent 的公司都以不同的方式处理这项技术,这个问题最近变得更加严重了。

本周,OpenAI 发表了一篇博客文章,将 Agent 定义为"能够代表用户独立完成任务的自动化系统"。然而就在同一周,该公司发布的开发者文档却将 Agent 定义为"配备了指令和工具的 LLM(大语言模型)"。OpenAI 的 API 产品营销负责人 Leher Pathak 随后在 X 上的帖子中表示,她理解"助手"(assistants)和"Agent"这两个术语是可以互换的,这进一步搅浑了水。

与此同时,微软的博客试图区分 Agent 和 AI 助手,前者被微软称为"AI 驱动世界的新应用",可以定制化以具备特定专业知识,而助手仅仅是帮助处理一般任务,比如起草邮件。

AI 实验室 Anthropic 更直接地谈到了 Agent 定义的大杂烩。在一篇博客文章building-effective-Agents中,Anthropic 表示,Agent "可以通过多种方式定义",既包括"能够长时间独立运行的全自主系统",也包括"遵循预定义工作流程的规范性实现"。

Salesforce 对 "Agent"的定义或许是范围最广的。据这家软件巨头称,"Agent 是一种无需人工干预即可理解并响应客户咨询的系统"。该公司的网站列出了六个不同的类别,从"简单反思型 Agent"到"基于效用的 Agent"。

为何如此混乱?

Agent 就像 AI 一样是一个模糊的概念,并且它们在不断发展。OpenAI、谷歌和 Perplexity 才刚刚开始推出他们认为是自家首批 Agent 的产品------OpenAI 的 Operator谷歌的 Project MarinerPerplexity 的购物 Agent------它们的功能各不相同,覆盖范围很广。

IDC 全球研究集团副总裁 Rich Villars 指出,科技公司在不严格遵守技术定义方面"有着悠久的历史,他们更关心在技术层面上想要实现什么,尤其是在快速发展的市场中。"

但根据 AI 学习平台 DeepLearning.ai 创始人 Andrew Ng 的说法,市场营销在很大程度上是罪魁祸首。"Agent 和 Agentic 工作流的概念曾经有其技术含义,但大约一年前,营销人员和一些大公司抓住了它们。"

德勤 AI 主管 Jim Rowan 表示,缺乏统一的 Agent 定义既是机遇也是挑战。一方面,这种模糊性带来了灵活性,让公司可以根据自身需求定制 Agent。另一方面,它可能导致"预期错位"以及难以衡量基于 Agent 的项目价值和 ROI(投资回报率)。"至少在一个组织内部,如果没有标准化的定义,就很难对绩效进行基准测试并确保结果的一致性,这可能导致对 Agent 应交付什么的解释各不相同,从而可能使项目目标和结果复杂化。最终,虽然灵活性可以推动创造性解决方案,但更标准化的理解将有助于企业更好地驾驭 AI Agent 并最大化其投资。"

不幸的是,行业似乎不太可能在短期内(甚至永远)围绕"Agent"的某一个定义达成一致。

相关推荐
DO_Community3 小时前
普通服务器都能跑:深入了解 Qwen3-Next-80B-A3B-Instruct
人工智能·开源·llm·大语言模型·qwen
WWZZ20253 小时前
快速上手大模型:机器学习3(多元线性回归及梯度、向量化、正规方程)
人工智能·算法·机器学习·机器人·slam·具身感知
deephub3 小时前
深入BERT内核:用数学解密掩码语言模型的工作原理
人工智能·深度学习·语言模型·bert·transformer
PKNLP3 小时前
BERT系列模型
人工智能·深度学习·bert
兰亭妙微4 小时前
ui设计公司审美积累 | 金融人工智能与用户体验 用户界面仪表盘设计
人工智能·金融·ux
AKAMAI4 小时前
安全风暴的绝地反击 :从告警地狱到智能防护
运维·人工智能·云计算
岁月宁静4 小时前
深度定制:在 Vue 3.5 应用中集成流式 AI 写作助手的实践
前端·vue.js·人工智能
galaxylove5 小时前
Gartner发布数据安全态势管理市场指南:将功能扩展到AI的特定数据安全保护是DSPM发展方向
大数据·人工智能
格林威5 小时前
偏振相机在半导体制造的领域的应用
人工智能·深度学习·数码相机·计算机视觉·视觉检测·制造
晓枫-迷麟6 小时前
【文献阅读】当代MOF与机器学习
人工智能·机器学习