这几天一直在测国产模型,GPT5.5 都没怎么玩!
抽空玩了下 Codex + GPT5.5 + Browser Use 做开发太香了!
最重要的一点是 GPT5.5 好像不那么油腻,爱废话了。
感觉就像变了一个人!
我们先来看一下网页版。
我提了一个问题:
Claude Code 是什么?可以吃么?
这是新版 Auto:

这是新版 5.5 Thinking:

首先两种模式,黑话都少了很多,说话正常了很多!
另外 GPT5.5 thinking 这种模式,明显更加简洁,表情包也少了很多。
再看一个例子。
Claude Code 的 recap 是什么功能?
新版 Auto 模式:

GPT5.5 thinking 模式:

首先两种模式下,都没有了"一句话总结,结论先行"这种表述了,而是变成了"一句话:",从字数上看就简洁了很多。
主要是没有了那种把你当弱智的感觉。
另外 5.5 thinking 明显简短了很多,表情包几乎消失不见了。
而且那种疯狂叠括号和破折号的问题也没有了。
完了,GPT 你变了,变得让我好陌生!

你无法稳稳的接住我了!
然后再来看一下写代码。
我让他帮我改了一个小需求:

这个需求主要是一个修改需求。
我的 CodingPlan 测试平台,添加了一个可以设置思考能力的选项。但是思考预算的设置部分有点小 bug,所以我让它帮我优化一下。
它查找了相关的资料,并帮我做了修改。大概花了 7 分 29 秒!

改得挺好的:
diff
- platform-form.tsx:去掉 step={1024},改为 step={1},所以 8000 不再被浏览器原生校验拦截。
- platform-form.tsx:新增常用预算下拉:1024 / 2048 / 4096 / 8000 / 12000 / 16000 / 32000,同时保留自定义输入。
- route.ts:新增平台时也保存 thinkingConfig,避免新增配置丢失。
- anthropic-client.ts:手动思考预算较大时,自动抬高默认 max_tokens,避免 Anthropic 要求 budget_tokens < max_tokens 导致请求失败。
通过修改总结里可以看到,它首先去掉了原先的步进限制。
然后新增了 6 个档位,同时保留了自定义输入框。
同时还帮我更新了"新增功能",避免新增的时候配置丢失,很全面。
另外还考虑到了 max_tokens 要大于 budget_tokens 的问题,做了一些优化处理。
功能不大,完成的挺好。
但是重点不是在这里,重点是它自动做了功能验证。

自动验证并不是在代码上验证,而是直接调用浏览器,直接操控鼠标进行验证。这个就太牛逼了!
你可以看到鼠标自己动,自己添加平台,自己切换思考模式,自己验证修改功能。
这个 Browser Use 功能非常强大,也非常实用。
有了这个东西,前端的开发和测试就可以完成闭环了!
除了浏览器的使用之外,Codex 的开发相关功能也非常齐全。

可以一键运行项目,可以用Git管理代码版本,可以打开终端,可以查看文件目录,可以审查修改代码。
它的 Computer Use 也很强,即便是在 Windows 上,各种软件的安装配置都非常丝滑。
比如你没有开发环境,它会自动帮你安装。如果涉及到大的变动,会先询问你,你只要说继续,它就帮你搞定。
所以综合来看,Codex + GPT5.5 + 电脑和浏览器操作,已经是一个不错的开发工具了!

我以前最喜欢的就是 Claude Code + Chrome 插件,现在的 Codex 对电脑和浏览器的操控好像比 Claude Code 这个组合还要丝滑。
另外GPT还有两个特点,一个是不用担心封号,一个是配额要比 Opus 多。
我目前在尝试:硬核的,需要开疆扩土的任务让 Opus 4.7 上,一旦攻克难题之后,其他问题就交给 Codex 来接手。
我当然不会真的抛弃 Opus,它还是我手里最猛的一员猛将。