我的AI编程体验：从白嫖到付费，我为什么最终留下了Codex

说出来你们可能不信，现在我每天真正花在"自己一行一行敲代码"上的时间，可能还不到 1 小时。剩下的大部分时间，不是在跟 AI 聊需求、让它生成代码，就是在验证结果、微调细节，顺便摸摸鱼。

当然，这并不代表 AI 已经强到可以完全代替开发者了。至少以我目前的使用体验来看，它更像是一个效率很高的搭子：能帮你快速完成很多重复但耗时的工作，但真正需要判断、经验和兜底的地方，最后还是得自己来。

我开始接触 AI 编程其实不算早，但一路用下来，从最开始的"能免费绝不花钱"，到后面愿意自己掏钱订阅，我对这些工具的看法也确实变了不少。

最开始，我对 AI 编程其实有点"将信将疑"

我最早接触到的是 Cursor，大概是去年上半年。周末在家试了试，第一感觉就是：生成页面是真的快，很多原本要自己搭半天的东西，它几分钟就能给个雏形。

但问题也很现实，7 天试用一过，就没法继续深度体验了。我当时本来就没有太强的付费意愿，想着"先白嫖再说"，于是这事也就先搁下了。

后来我又试了 GitHub Copilot。思路还是一样，先体验，再决定要不要长期用。结果没过几天也开始收费，我就继续贯彻自己的原则：能不花钱，就先不花钱。

再后来，我开始用通义灵码的 VSCode 插件。平心而论，它并不是完全没用。写一些常规代码、做代码补全、修简单 bug，确实能省掉一点时间。但只要问题一复杂，体验就会明显下降。你会发现它不是完全不会做，而是容易在一个错误方向上反复绕圈，问了很多次，最后还是解决不了。

那时候我对 AI 编程的整体印象就是：能帮点小忙，但离"真能打"还有点距离。

真正让我高频用起来的，是 TRAE

大概去年年底，我换了新工作。刚好那段时间字节出了一个 AI 编辑器，叫 TRAE。我试用了一下，发现它的界面做得挺顺眼，而且还能直接导入 VSCode 的插件和配置，这一点对我来说很友好，所以我很快就在新工作里切到 TRAE 了。

我现在主要在做两个项目，一个后台管理系统，一个社区项目。这两个项目基本都是从 0 到 1 慢慢搭起来的，而这种新项目，其实特别适合 AI 编辑器发挥。

因为新项目的上下文相对干净，历史包袱少，很多页面和功能都比较标准化。像后台管理这种项目，如果不太依赖 UI 设计图，我通常会直接开 solo 模式，把需求文档和原型丢进去。正常情况下，不到一刻钟，它就能把一个模块的页面和基础功能做个七七八八，剩下的我再自己补一补、调一调就行。

这一点对开发效率的提升，是真的非常明显。

AI 很适合做"标准活"，但 UI 和复杂问题还是别太指望它一步到位

不过，用得越多，我也越能感觉到 AI 的边界在哪。

比如社区项目这类对界面要求更高的东西，我也试过用 MCP 的方式去还原页面，但最终的结果很多时候更像是"对着截图搭了个差不多"，视觉细节、层次感、交互感还是差点意思。所以如果是对 UI 还原要求高的项目，最后大概率还是得自己手动调。

功能层面也差不多。大多数常规功能，AI 的确能做，而且做得不算差；但只要一涉及复杂逻辑、边界情况多、上下文依赖强的问题，它就不一定稳定了。不是完全做不了，而是经常做得"不够让人放心"。

所以我后来慢慢有了一个比较明确的判断：

AI 最擅长的，不是替你完成整个项目，而是帮你快速处理那些本来不难、但特别耗时间的标准化工作。

比如搭页面、写表单、补接口调用、生成基础逻辑、修一些比较直接的 bug。这些事情如果都自己来做，单个看不难，但堆起来特别费时间。AI 一旦把这部分吃掉，开发者就能把精力更多放在那些真正需要经验和判断的地方。

真正让我决定付费的，是 Codex

到了年初，一个前同事给我推荐了 Codex。他当时的评价挺直接：体验上跟那个大名鼎鼎但也经常出状况的 Claude 差不了太多，但价格相对能接受，一个月 60 块左右。

我那时候刚好遇到一个功能，TRAE 做出来的结果始终不太理想。于是同事给了我一个 Key，让我用 Codex CLI 的方式试了一下。

结果几分钟后，我验证了一遍，发现它不但把需求完成得比较到位，而且还有一个地方特别让我惊艳：它给出的回答，往往不只是"把事做完"，还会顺手补上一些优化建议。而且这些建议很多都挺靠谱，不是那种看起来很专业、实际上落不了地的空话。

这个体验对我的触动还挺大的。

因为对我来说，真正值得付费的 AI 编程工具，不是"能写代码"就够了，而是它在关键时候能不能稳定地解决问题。前者很多工具都能做到一点，后者就没那么容易了。

后来我对 AI 工具的判断标准，也慢慢变了

最开始我选择工具的第一标准，其实很简单：免费。

但用到后来，我发现一个工具值不值得花钱，关键不是它是不是最强，也不是它功能看起来有多花哨，而是它能不能真正融入你的工作流，持续帮你省时间、减负担。

Codex 在这方面对我来说是成立的。

后来同事还跟我说，用 Medium 模式可以稍微省一些 token，而且生成出来的代码质量也基本够用。再往后，我就自己订阅了 Codex。虽然我是通过国内中转站的方式开的，但一个月 60 块左右，对我来说还在可接受范围内。

最开始那会儿，月卡每周有 180 刀额度，根本用不完。我当时甚至还想过，要不要去闲鱼"分享"几份，把月卡钱赚回来。后来中转站调整了几次额度，现在降到 60 刀，对于我来说刚好够用。

模型不是越新越好，关键还是看性价比

最近 Codex 又升级到了 GPT-5.5，我也切过去试了一下。

但就我自己的体感来说，编程质量并没有出现特别明显的提升，至少没有提升到让我愿意接受 token 消耗翻倍的程度。所以目前我还是继续用 5.4，原因也很简单：够用，而且性价比更高。

这其实也是我现在看待 AI 工具的一个习惯。很多时候，新版本、新模型、新功能听起来都很诱人，但最终还是要回到实际使用体验上：它到底有没有让我更省时间，还是只是让我多花了点成本、顺便多了一点新鲜感。

最近让我觉得实用的，是它开始"动手"了

除了写代码本身，Codex 这几个月还有一个让我印象比较深的变化，就是它开始具备更多"直接动手"的能力了。

比如自动控制浏览器去排查 bug，这对前端开发来说就挺实用。以前很多问题你要自己打开页面、点来点去、截图、描述，再让 AI 理解；现在有些场景下，它能直接自己去看、自己去试，沟通成本会低很多。

还有一点也挺方便，就是在某些场景里，它甚至不需要 MCP，就可以直接访问 Figma 去辅助还原设计图。对于前端来说，这类能力一旦稳定下来，实际价值还是挺高的。

AI 确实重构了我的工作方式

到现在为止，Codex 已经算是我日常开发里比较稳定的一部分了。它不是完美的，也不是所有事情都能处理得很好，但它已经足够帮我承担掉大量重复、基础、标准化的工作。

而这些工作一旦被压缩掉，开发者真正需要投入的，就更多变成了：

需求理解、结果验证、细节调整、问题判断，以及最后的兜底。

所以如果你问我，AI 编程到底值不值得用，我的答案是：值得。

但如果你问我，它是不是已经强到可以让程序员彻底躺平，那我的答案也是：还远远没有。

它更像是一个效率放大器。你本来就会做的事情，它能帮你做得更快；你本来就懂的东西，它能帮你省掉很多重复劳动；但那些真正需要经验、判断和责任心的部分，最后还是得你自己扛。

只不过，哪怕只是这样，也已经足够让我每天少干很多活了。

而这，某种程度上，可能就是 AI 编程目前最实在的价值。