说出来你们可能不信,现在我每天真正花在"自己一行一行敲代码"上的时间,可能还不到 1 小时。剩下的大部分时间,不是在跟 AI 聊需求、让它生成代码,就是在验证结果、微调细节,顺便摸摸鱼。
当然,这并不代表 AI 已经强到可以完全代替开发者了。至少以我目前的使用体验来看,它更像是一个效率很高的搭子:能帮你快速完成很多重复但耗时的工作,但真正需要判断、经验和兜底的地方,最后还是得自己来。
我开始接触 AI 编程其实不算早,但一路用下来,从最开始的"能免费绝不花钱",到后面愿意自己掏钱订阅,我对这些工具的看法也确实变了不少。
最开始,我对 AI 编程其实有点"将信将疑"
我最早接触到的是 Cursor,大概是去年上半年。周末在家试了试,第一感觉就是:生成页面是真的快,很多原本要自己搭半天的东西,它几分钟就能给个雏形。
但问题也很现实,7 天试用一过,就没法继续深度体验了。我当时本来就没有太强的付费意愿,想着"先白嫖再说",于是这事也就先搁下了。
后来我又试了 GitHub Copilot。思路还是一样,先体验,再决定要不要长期用。结果没过几天也开始收费,我就继续贯彻自己的原则:能不花钱,就先不花钱。
再后来,我开始用通义灵码的 VSCode 插件。平心而论,它并不是完全没用。写一些常规代码、做代码补全、修简单 bug,确实能省掉一点时间。但只要问题一复杂,体验就会明显下降。你会发现它不是完全不会做,而是容易在一个错误方向上反复绕圈,问了很多次,最后还是解决不了。
那时候我对 AI 编程的整体印象就是:能帮点小忙,但离"真能打"还有点距离。
真正让我高频用起来的,是 TRAE
大概去年年底,我换了新工作。刚好那段时间字节出了一个 AI 编辑器,叫 TRAE。我试用了一下,发现它的界面做得挺顺眼,而且还能直接导入 VSCode 的插件和配置,这一点对我来说很友好,所以我很快就在新工作里切到 TRAE 了。
我现在主要在做两个项目,一个后台管理系统,一个社区项目。这两个项目基本都是从 0 到 1 慢慢搭起来的,而这种新项目,其实特别适合 AI 编辑器发挥。
因为新项目的上下文相对干净,历史包袱少,很多页面和功能都比较标准化。像后台管理这种项目,如果不太依赖 UI 设计图,我通常会直接开 solo 模式,把需求文档和原型丢进去。正常情况下,不到一刻钟,它就能把一个模块的页面和基础功能做个七七八八,剩下的我再自己补一补、调一调就行。
这一点对开发效率的提升,是真的非常明显。
AI 很适合做"标准活",但 UI 和复杂问题还是别太指望它一步到位
不过,用得越多,我也越能感觉到 AI 的边界在哪。
比如社区项目这类对界面要求更高的东西,我也试过用 MCP 的方式去还原页面,但最终的结果很多时候更像是"对着截图搭了个差不多",视觉细节、层次感、交互感还是差点意思。所以如果是对 UI 还原要求高的项目,最后大概率还是得自己手动调。
功能层面也差不多。大多数常规功能,AI 的确能做,而且做得不算差;但只要一涉及复杂逻辑、边界情况多、上下文依赖强的问题,它就不一定稳定了。不是完全做不了,而是经常做得"不够让人放心"。
所以我后来慢慢有了一个比较明确的判断:
AI 最擅长的,不是替你完成整个项目,而是帮你快速处理那些本来不难、但特别耗时间的标准化工作。
比如搭页面、写表单、补接口调用、生成基础逻辑、修一些比较直接的 bug。这些事情如果都自己来做,单个看不难,但堆起来特别费时间。AI 一旦把这部分吃掉,开发者就能把精力更多放在那些真正需要经验和判断的地方。
真正让我决定付费的,是 Codex
到了年初,一个前同事给我推荐了 Codex。他当时的评价挺直接:体验上跟那个大名鼎鼎但也经常出状况的 Claude 差不了太多,但价格相对能接受,一个月 60 块左右。
我那时候刚好遇到一个功能,TRAE 做出来的结果始终不太理想。于是同事给了我一个 Key,让我用 Codex CLI 的方式试了一下。
结果几分钟后,我验证了一遍,发现它不但把需求完成得比较到位,而且还有一个地方特别让我惊艳:它给出的回答,往往不只是"把事做完",还会顺手补上一些优化建议。而且这些建议很多都挺靠谱,不是那种看起来很专业、实际上落不了地的空话。
这个体验对我的触动还挺大的。
因为对我来说,真正值得付费的 AI 编程工具,不是"能写代码"就够了,而是它在关键时候能不能稳定地解决问题。前者很多工具都能做到一点,后者就没那么容易了。

后来我对 AI 工具的判断标准,也慢慢变了
最开始我选择工具的第一标准,其实很简单:免费。
但用到后来,我发现一个工具值不值得花钱,关键不是它是不是最强,也不是它功能看起来有多花哨,而是它能不能真正融入你的工作流,持续帮你省时间、减负担。
Codex 在这方面对我来说是成立的。
后来同事还跟我说,用 Medium 模式可以稍微省一些 token,而且生成出来的代码质量也基本够用。再往后,我就自己订阅了 Codex。虽然我是通过国内中转站的方式开的,但一个月 60 块左右,对我来说还在可接受范围内。
最开始那会儿,月卡每周有 180 刀额度,根本用不完。我当时甚至还想过,要不要去闲鱼"分享"几份,把月卡钱赚回来。后来中转站调整了几次额度,现在降到 60 刀,对于我来说刚好够用。

模型不是越新越好,关键还是看性价比
最近 Codex 又升级到了 GPT-5.5,我也切过去试了一下。
但就我自己的体感来说,编程质量并没有出现特别明显的提升,至少没有提升到让我愿意接受 token 消耗翻倍的程度。所以目前我还是继续用 5.4,原因也很简单:够用,而且性价比更高。
这其实也是我现在看待 AI 工具的一个习惯。很多时候,新版本、新模型、新功能听起来都很诱人,但最终还是要回到实际使用体验上:它到底有没有让我更省时间,还是只是让我多花了点成本、顺便多了一点新鲜感。
最近让我觉得实用的,是它开始"动手"了
除了写代码本身,Codex 这几个月还有一个让我印象比较深的变化,就是它开始具备更多"直接动手"的能力了。
比如自动控制浏览器去排查 bug,这对前端开发来说就挺实用。以前很多问题你要自己打开页面、点来点去、截图、描述,再让 AI 理解;现在有些场景下,它能直接自己去看、自己去试,沟通成本会低很多。
还有一点也挺方便,就是在某些场景里,它甚至不需要 MCP,就可以直接访问 Figma 去辅助还原设计图。对于前端来说,这类能力一旦稳定下来,实际价值还是挺高的。

AI 确实重构了我的工作方式
到现在为止,Codex 已经算是我日常开发里比较稳定的一部分了。它不是完美的,也不是所有事情都能处理得很好,但它已经足够帮我承担掉大量重复、基础、标准化的工作。
而这些工作一旦被压缩掉,开发者真正需要投入的,就更多变成了:
需求理解、结果验证、细节调整、问题判断,以及最后的兜底。
所以如果你问我,AI 编程到底值不值得用,我的答案是:值得。
但如果你问我,它是不是已经强到可以让程序员彻底躺平,那我的答案也是:还远远没有。
它更像是一个效率放大器。你本来就会做的事情,它能帮你做得更快;你本来就懂的东西,它能帮你省掉很多重复劳动;但那些真正需要经验、判断和责任心的部分,最后还是得你自己扛。
只不过,哪怕只是这样,也已经足够让我每天少干很多活了。
而这,某种程度上,可能就是 AI 编程目前最实在的价值。