今天,OpenAI彻底颠覆AI助手!ChatGPT智能体上线,融合三大AI

具备自主决策能力的ChatGPT智能体正式发布!无缝融合思考、操作、进化三大AI引擎。

今天凌晨,OpenAI 临时直播,奥特曼与四位研究员正式宣告 ChatGPT Agent 上线------一个能自主思考、规划并执行复杂任务的AI智能体。

奥特曼更是直言「这让我真切感受到AGI的存在」。据介绍,ChatGPT Agent 融合了Operator智能体网页交互能力、Deep Research 的互联网信息搜集能力,以及 ChatGPT的对话能力,成为了一个统一智能体。

它具备自主思考和行动的能力,能够主动从Operator、Deep Research 和 ChatGPT的技能库中选择合适的工具,来完成各种超复杂任务。这意味着ChatGPT 不再只是那个大家熟悉的问答机器人,还能通过 "内置计算机" 代表用户完成复杂的多步骤任务。

OpenAI 介绍称,ChatGPT 智能体能够通过互联网搜索或 API 获取数据,进行深入的财务研究、制作精美的幻灯片,或者预定活动、规划行程。

在内部基准测试中,ChatGPT 智能体展现出能够处理入门级投资银行分析师(1 - 3 年工作经验)任务的能力,比如为财富 500 强公司构建符合准则的财务报表模型,或为私有化交易构建杠杆收购模型。

在演示中,OpenAI 给出了有趣的案例。根据结婚请柬上的日期、地点和着装要求,ChatGPT 智能体根据提示词,通过自主浏览、显示思维链并执行任务,圆满地完成了工作,列出了所有推荐的男装、鞋子商品,并附上推荐理由和链接。

在另一个案例中,它被要求根据美国职业棒球大联盟赛程,规划一条在2025 赛季常规赛期间,走遍全美 30 座大联盟棒球队的观赛路线,推荐酒店住宿,最后以电子表格的形式呈现并生成一张可视化路线图,它也出色地完成了任务。

用户甚至可以要求它分析三个竞争对手并制作幻灯片演示文稿,只需要一个提示,ChatGPT 智能体就会帮你完成所有工作,你只需等待结果就好。

技术实现层面,OpenAI 采用了创新的"链式推理架构"。不同于常规模型的单次响应,智能体在接收指令后会启动多轮内部思考:首先解析任务目标,然后规划执行路径,接着调用浏览器、代码编辑器等外部工具,最后验证结果并调整策略。

此外,还配备了多种网络工具,包括可视化浏览器、文本浏览器和直接API 访问权限。

对于大家关心的数据安全问题,OpenAI 表示,ChatGPT 智能体在执行敏感或重要操作(例如发送邮件、购买商品、提交个人数据)时,会明确征求用户授权。

当用户在使用ChatGPT 智能体访问金融网站时,将不能离开当前标签页,否则工具会停止运作。而对于让ChatGPT 智能体炒股这类操作暂时受到限制,主要考量是避免 AI 出错导致高额损失。

在安全性方面,它具备主动监督和风险缓解功能,能够主动拒绝高风险任务,例如金融交易或敏感法律互动。

根据OpenAI 公布的测试数据,ChatGPT 智能体在 "人类最后的考试" 中,单次尝试通过率达 41.6%,远超此前 OpenAI o3 模型的 20.3% 和 Deep Research 的 26.6%。

在 BrowseComp基准中,它以 68.9% 的成绩创 SOTA,比 Deep Research 高17.4%。

同时,在 WebArena⁠ 基准测试中,相较于由 o3 驱动的 CUA,ChatGPT 智能体表现更佳。

目前该功能已向 Pro、Plus 和 Team 用户开放,OpenAI 表示将在未来几周内向更多用户开放,并整合更多功能。据内部路线图,未来智能体将支持自定义工作流,允许企业接入内部系统。

想象一下,当AI能直接操作公司的 ERP、CRM 系统,自动处理财务报销、客户跟进等事务,或许整个办公生态都将被重新定义。

相关推荐
之歆3 小时前
Spring AI入门到实战到原理源码-MCP
java·人工智能·spring
知乎的哥廷根数学学派4 小时前
面向可信机械故障诊断的自适应置信度惩罚深度校准算法(Pytorch)
人工智能·pytorch·python·深度学习·算法·机器学习·矩阵
且去填词4 小时前
DeepSeek :基于 Schema 推理与自愈机制的智能 ETL
数据仓库·人工智能·python·语言模型·etl·schema·deepseek
待续3014 小时前
订阅了 Qoder 之后,我想通过这篇文章分享一些个人使用心得和感受。
人工智能
weixin_397578024 小时前
人工智能发展历史
人工智能
强盛小灵通专卖员4 小时前
基于深度学习的山体滑坡检测科研辅导:从论文实验到系统落地的完整思路
人工智能·深度学习·sci·小论文·山体滑坡
OidEncoder4 小时前
从 “粗放清扫” 到 “毫米级作业”,编码器重塑环卫机器人新能力
人工智能·自动化·智慧城市
Hcoco_me4 小时前
大模型面试题61:Flash Attention中online softmax(在线softmax)的实现方式
人工智能·深度学习·自然语言处理·transformer·vllm
阿部多瑞 ABU5 小时前
`chenmo` —— 可编程元叙事引擎 V2.3+
linux·人工智能·python·ai写作
极海拾贝5 小时前
GeoScene解决方案中心正式上线!
大数据·人工智能·深度学习·arcgis·信息可视化·语言模型·解决方案