GPT-5.4 发布!再看 OpenClaw:AI 真正危险的,不是更会聊天,而是开始自己“干活”

当你看到 GPT-5.4-Thinking 和 GPT-5.4 Pro 发布之后,可以准备取消你的 Claude Code 订阅了! 不用再花高昂的费用还要受 A 社 的封号折磨了!

另外,大家都听过 🦞 OpenClaw, 而 GPT-5.4 简直就是 OpenClaw 的天选模型!

前段时间 OpenClaw 创始人 Peter Steinberger 已加入 OpenAI,可以看出 OpenAI 把部分重心放在了 Computer Use Agent 方向。

但这次 GPT-5.4 的表现确实比之前的提升了很多,比如有了 1M 的上下文。 Agent tool use 的评分甚至超过了 Claude Opus 4.6

GPT-5.4 目前发布了 Thinking + Pro 两个版本,并且上线 ChatGPT Web、API 和 Codex。

GPT-5.4 Thinking 可以先给出一个前置计划,让用户在它执行过程中及时纠偏;在 API 和 Codex 里,它又具备原生 computer use、长上下文和更强工具搜索能力。

如果说过去几代大模型的竞争,核心是"更聪明、更会写、更会答",那么 GPT-5.4 的信号已经明显变了。

OpenAI 在官方发布里直接把它定义为"为专业工作设计"的前沿模型,并且强调它把最近几轮最关键的进步:推理、Coding、Agent 工作流、工具调用、电脑操作 都合成到了 GPT-5.4 模型里。

GPT-5.4 到底做了什么系统整合?

GPT-5.4 很强的地方,不只是某一项 benchmark 拉高了多少,而是 OpenAI 这次把几条原本分散的能力线收束到一起了。

官方写得很明确:GPT-5.4 继承了 GPT-5.3-Codex 的 coding 能力,同时提升了跨工具、跨软件环境、跨专业任务的表现;还支持最多 1M token 上下文,并通过 tool search 在大规模工具生态里更高效地找到和调用正确工具

它在 SWE-Bench Pro 上表现可匹敌甚至超过 GPT-5.3-Codex,同时在推理过程中延迟更低。

用户不再需要反复判断:"这件事该用聊天模型、编程模型、agent 模型,还是另一个专门工具?"

OpenAI 想做的显然是让同一个模型覆盖越来越多的专业场景,这比单个榜单第一还重要。

因为真正推动 AI 进入企业预算的,从来都不是 demo,而是可集成、可复用、可交付。

GPT-5.4 和 Opus 4.6 到底有什么区别?

GPT-5.4 瞄准的方向是"全都干的专业工作模型",而 Opus 4.6 像是"超强长程推理与 coding/agent 模型"。

Anthropic 对 Claude Opus 4.6 的官方表述非常明确:它们强调的是 Opus 4.6 在复杂多步骤任务、长 coding、agentic planning、长上下文稳定性和复杂研究工作上的跃升。

OpenAI 的主要是:推理 + coding + computer use + knowledge work + tools。

也就是说,把文档、Excel 表格、PPT、代码、网页操作、工具调用放进同一个工作系统里。

Anthropic 的主要是:长程任务、复杂推理、agent 规划、长上下文稳定、复杂 coding。

它特别强调模型会更主动拆任务、并行调用子任务、在长 session 中保持产出质量,并且在复杂代码库与研究工作里表现更像资深协作者。

对于 GPT-5.4 和 Opus 4.6 使用场景来选的话:

如果你在意的是:文档、表格、PPT、研究、工具调用、浏览器/桌面操作、Coding 全部想交给一个统一模型来做,GPT-5.4 的路线更完整。

如果你在意的是:复杂 coding、长程 agent、长上下文稳定、复杂研究链路、大代码库处理,Opus 4.6 很可能更对味。

也就是如果你最近都在用 OpenClaw 的话,GPT-5.4 无疑是当前最好的选择,很符合模型的一个使用场景。

GPT-5.4 和 OpenClaw 结合

单看 GPT-5.4,你会觉得它更强了。

单看 OpenClaw,你会觉得 Agent 更火了。

但如果把这两件事合起来看,问题就变成了:

一个更会推理、更会 Coding、更会调用工具、更会操作电脑的模型,如果装进一个能持续运行、能管理 skills、能接触本地环境的 Agent 外壳里,会发生什么?

答案大概是:AI 会从"内容生成器"变成"任务执行器"。

未来最有价值的 AI,不一定是最会说的那个,而是最能进入真实工作流、拿到权限、调动工具并交付结果的那个。

OpenAI 在 GPT-5.4 上强化 computer use,不只是为了做一个 agent 功能。

它在 OSWorld-Verified 和 BrowseComp 这类更接近真实任务执行的评测上提升明显,说明模型已经被训练去理解界面、采取动作、完成链路。

而 OpenClaw 刚好提供了一种大众能理解的表达:让 AI 不再只待在聊天框里,而是进入文件、浏览器、消息通道和本地工具链。

所以 GPT-5.4 和 OpenClaw 组合一起,可以比作为:AI 的"脑"和"手",正在汇合。

如何才能使用 OpenClaw 呢?

Claude 和 Gemini 都禁止了在 OpenClaw 中使用,而且 Claude 授权使用 OpenClaw 的话,简直就是在烧钱,除非你可以成功开通 Max 会员(并且不封)。

毕竟 OpenClaw 创始人已经去了 OpenAI,所以还得是 ChatGPT 的 Codex。(不用担心封,只要Codex更新,还会给你突然重置额度)

最划算,优惠的方式就是 在 OpenClaw 通过授权 Codex 进行登录你的 GPT 账号就可以使用。只要你是 GPT 会员(Plus、Business、Pro)就可以用这个方式。

不知道国内怎么去开通 GPT 会员的话,你可以使用这个官网,正规渠道用了很久,一键升级,小白都会。

GPT 一键升级官网

最后

很多人看模型发布,习惯问一句:"它比上一代强多少?"

但 GPT-5.4 更值得问的问题其实是:它把哪些原本分散的能力,第一次组织成了一个可工作的整体?

个人觉得 GPT-5.4:它不是在继续优化聊天体验,而是在重新定义什么叫"模型交付能力"。

如果说过去两年,AI 产业最核心的问题是"模型够不够聪明"; 那么从 GPT-5.4 到 OpenClaw,这个问题正在换成另一个更现实的问题:

当 AI 既足够聪明,又开始拥有手脚,我们到底准备好把多少工作交给它?

相关推荐
飞哥数智坊12 小时前
分享被迫变直播:AI·Spring养虾记就这样上线了
人工智能
Mr_Lucifer15 小时前
「一句话」生成”小红书“式金句海报(CodeFlicker + quote-poster-generator)
人工智能·aigc·visual studio code
冬奇Lab15 小时前
OpenClaw 深度解析(五):模型与提供商系统
人工智能·开源·源码阅读
冬奇Lab16 小时前
一天一个开源项目(第42篇):OpenFang - 用 Rust 构建的 Agent 操作系统,16 层安全与 7 个自主 Hands
人工智能·rust·开源
IT_陈寒16 小时前
SpringBoot性能飙升200%?这5个隐藏配置你必须知道!
前端·人工智能·后端
yiyu071616 小时前
3分钟搞懂深度学习AI:反向传播:链式法则的归责游戏
人工智能·深度学习
机器之心16 小时前
OpenClaw绝配!GPT-5.4问世,AI能力开始大一统,就是太贵
人工智能·openai