大家好,这里是架构资源栈 !点击上方关注,添加"星标",一起学习大厂前沿架构!
关注、发送C1
即可获取JetBrains全家桶激活工具和码!
在过去的一年中,一位初创公司创始人每天都在与 AI 编程助手共事。他使用的主力工具包括 Cursor 编辑器和 Anthropic 的 Claude Sonnet 模型,这些模型一度被公认为编程能力最强的 LLM 模型之一。尤其是在 TypeScript 项目中,它们能写能改还能提建议,堪称"最佳拍档"。
但就在这个春天,他发现了一个新的变化------一场由 OpenAI 推出的 o3 模型引发的效率革命正在悄然上演。
用 o3 写代码,"理论慢,实际上更快"
在 Web Summit Vancouver 展示即将到来之前,这位创业者与联合创始人 Jenn 处于冲刺状态。尽管 Claude Sonnet 一直是他们的主力,但在面对复杂问题时,它也会暴露出 LLM 的老毛病:添加不必要的依赖、修改失败测试为"跳过"、或者误删重要逻辑。
于是他尝试用据说"很慢"的 OpenAI o3 模型解决难题------并发现效果居然意外地好。虽然响应时间长,但 o3 能更好地理解意图、判断进度、运用工具、并主动修复代码。
最令他惊喜的是:o3 在实际开发中的速度,竟然比"更快"的模型快。它更少出错,更少返工,最终节省了大量调试和人工改正的时间。
唯一的问题是------它太贵了。
每天50美元,月烧1000美元的AI编程账单
随着使用频率提升,o3 模型每天的调用费用很快攀升至 50 左右,折算下来每月达 1000。他在 Cursor 上为自己和团队设定了这个预算上限------一个让人咋舌的数字。
但 Jenn 认真一算:请一个资深工程师每月成本轻松超出这个数十倍。如果这个 AI "合伙人"真的效率这么高,这笔投资其实是值得的。
"我们将其当成一个实验:3周内默认使用 o3,全力冲刺。" ------创始人如是说
他们很快发现,这不仅值,而且可能是目前市面上最划算的"编程助手"之一。
为什么 o3 比 GPT-4、Claude 更值钱?
他们总结出大型"思维模型"(thinking models,如 o3 和 Claude Opus)相比于 GPT-4.1 和 Claude Sonnet 的六大优势:
- 更懂如何使用工具(命令行、脚本)定位问题
- 更少提出冗长风险高的代码补丁
- 更精准找到已有代码,而非重复造轮子
- 更少发生"奖励黑客行为"(如注释掉测试)
- 更像人类搭档一样思考并评估技术方案
- 更遵循项目规则(如避免添加不存在的依赖)
他们发现,o3 不仅是编码工具,更像是一位可以"托付"的工程师。
如何"高效花掉"这 1000 美元?
要让 o3 值回票价,需要用"协作思维"看待 AI 编程助手。他们总结出几个实践经验,帮助开发者提高回报比:
- 尽早发现错误:越早暴露 bug,修复成本越低。善用 Linter、Formatter 和测试用例,让 AI 专注于"模糊问题"。
- 选择稳定技术栈:LLM 更擅长主流工具链。别用奇技淫巧,比如 Haskell 编译到 WebAssembly。
- 整理好项目规则 :比如 Cursor 的
.cursor/rules
文件,让 AI 避免走歪路,提升团队协作一致性。 - 优化开发脚本:比如快速查看 CI 错误、精简日志输出方式,让 AI 更容易理解上下文。
- 写可读性强的代码:小文件、清晰命名、类型注解,不仅提升人类阅读体验,也帮 AI 更好地推理。
- 同理心看待模型:它不是全能的,观察它"卡壳"的地方,主动优化环境,提升模型效率。
o3 降价了,现在更"香"了
最初,他们每月使用 o3 成本高达 1000。幸运的是,2025年6月 OpenAI 宣布将 o3 推理成本降低了 80%,紧接着 Cursor 发布了 Ultra 计划,每月 200 即可使用更大量的 o3 请求。
此外,还有如下组合可以参考:
- $200/月订阅 Claude Code Max,结合按量使用 o3
- 在 Slack 或 Web 上启动 Cursor 后台代理
- 使用多个代理协作完成 PR 提交、代码审查、bug 定位等任务
- 将 o3-pro 设置为并发运行 10 个模型,再自动挑选最佳输出
- 分别在两个代码窗口里配备两个代理,同时处理多个任务

结语:代理模型不只是"写代码",而是扩展开发力
这场从 Claude 到 o3 的转变,不只是模型性能的提升,更是一种开发范式的进化。从"AI 帮你写烂代码赶 Demo",变成"多个智能代理协作优化维护性良好的产品代码"。
用 Thomas Ptacek 的话说:
"即使是最依赖 Claude 的开发者,也仍然保有审美、判断和方向感。AI 清理繁琐,腾出时间专注真正重要的事。"
AI 编程助手的价值,不在于"取代开发者",而在于"让开发者更专注于系统设计和用户价值"。这就是他那 $1000 花得值的原因------真正的生产力提升,远超那张账单本身。
更多参考:
- Cursor Ultra Plan 发布页(cursor.com/blog/new-tier)
- OpenAI o3 价格公告(openai.com/pricing)
- .cursor/rules 用法指南
- Andrej Karpathy 与 Shopify 工程负责人关于代理成本的讨论(X平台)
这一切正在发生,也许你也该试试和 AI 一起写代码了。
如果这篇文章对你有帮助的话,别忘了【在看】【点赞】支持下哦~
原文地址:mp.weixin.qq.com/s/n24-VSUs0...
本文由博客一文多发平台 OpenWrite 发布!