我的AI编程体验:从白嫖到付费,我为什么最终留下了Codex

说出来你们可能不信,现在我每天真正花在"自己一行一行敲代码"上的时间,可能还不到 1 小时。剩下的大部分时间,不是在跟 AI 聊需求、让它生成代码,就是在验证结果、微调细节,顺便摸摸鱼。

当然,这并不代表 AI 已经强到可以完全代替开发者了。至少以我目前的使用体验来看,它更像是一个效率很高的搭子:能帮你快速完成很多重复但耗时的工作,但真正需要判断、经验和兜底的地方,最后还是得自己来。

我开始接触 AI 编程其实不算早,但一路用下来,从最开始的"能免费绝不花钱",到后面愿意自己掏钱订阅,我对这些工具的看法也确实变了不少。

最开始,我对 AI 编程其实有点"将信将疑"

我最早接触到的是 Cursor,大概是去年上半年。周末在家试了试,第一感觉就是:生成页面是真的快,很多原本要自己搭半天的东西,它几分钟就能给个雏形。

但问题也很现实,7 天试用一过,就没法继续深度体验了。我当时本来就没有太强的付费意愿,想着"先白嫖再说",于是这事也就先搁下了。

后来我又试了 GitHub Copilot。思路还是一样,先体验,再决定要不要长期用。结果没过几天也开始收费,我就继续贯彻自己的原则:能不花钱,就先不花钱。

再后来,我开始用通义灵码的 VSCode 插件。平心而论,它并不是完全没用。写一些常规代码、做代码补全、修简单 bug,确实能省掉一点时间。但只要问题一复杂,体验就会明显下降。你会发现它不是完全不会做,而是容易在一个错误方向上反复绕圈,问了很多次,最后还是解决不了。

那时候我对 AI 编程的整体印象就是:能帮点小忙,但离"真能打"还有点距离。

真正让我高频用起来的,是 TRAE

大概去年年底,我换了新工作。刚好那段时间字节出了一个 AI 编辑器,叫 TRAE。我试用了一下,发现它的界面做得挺顺眼,而且还能直接导入 VSCode 的插件和配置,这一点对我来说很友好,所以我很快就在新工作里切到 TRAE 了。

我现在主要在做两个项目,一个后台管理系统,一个社区项目。这两个项目基本都是从 0 到 1 慢慢搭起来的,而这种新项目,其实特别适合 AI 编辑器发挥。

因为新项目的上下文相对干净,历史包袱少,很多页面和功能都比较标准化。像后台管理这种项目,如果不太依赖 UI 设计图,我通常会直接开 solo 模式,把需求文档和原型丢进去。正常情况下,不到一刻钟,它就能把一个模块的页面和基础功能做个七七八八,剩下的我再自己补一补、调一调就行。

这一点对开发效率的提升,是真的非常明显。

AI 很适合做"标准活",但 UI 和复杂问题还是别太指望它一步到位

不过,用得越多,我也越能感觉到 AI 的边界在哪。

比如社区项目这类对界面要求更高的东西,我也试过用 MCP 的方式去还原页面,但最终的结果很多时候更像是"对着截图搭了个差不多",视觉细节、层次感、交互感还是差点意思。所以如果是对 UI 还原要求高的项目,最后大概率还是得自己手动调。

功能层面也差不多。大多数常规功能,AI 的确能做,而且做得不算差;但只要一涉及复杂逻辑、边界情况多、上下文依赖强的问题,它就不一定稳定了。不是完全做不了,而是经常做得"不够让人放心"。

所以我后来慢慢有了一个比较明确的判断:

AI 最擅长的,不是替你完成整个项目,而是帮你快速处理那些本来不难、但特别耗时间的标准化工作。

比如搭页面、写表单、补接口调用、生成基础逻辑、修一些比较直接的 bug。这些事情如果都自己来做,单个看不难,但堆起来特别费时间。AI 一旦把这部分吃掉,开发者就能把精力更多放在那些真正需要经验和判断的地方。

真正让我决定付费的,是 Codex

到了年初,一个前同事给我推荐了 Codex。他当时的评价挺直接:体验上跟那个大名鼎鼎但也经常出状况的 Claude 差不了太多,但价格相对能接受,一个月 60 块左右。

我那时候刚好遇到一个功能,TRAE 做出来的结果始终不太理想。于是同事给了我一个 Key,让我用 Codex CLI 的方式试了一下。

结果几分钟后,我验证了一遍,发现它不但把需求完成得比较到位,而且还有一个地方特别让我惊艳:它给出的回答,往往不只是"把事做完",还会顺手补上一些优化建议。而且这些建议很多都挺靠谱,不是那种看起来很专业、实际上落不了地的空话。

这个体验对我的触动还挺大的。

因为对我来说,真正值得付费的 AI 编程工具,不是"能写代码"就够了,而是它在关键时候能不能稳定地解决问题。前者很多工具都能做到一点,后者就没那么容易了。

后来我对 AI 工具的判断标准,也慢慢变了

最开始我选择工具的第一标准,其实很简单:免费。

但用到后来,我发现一个工具值不值得花钱,关键不是它是不是最强,也不是它功能看起来有多花哨,而是它能不能真正融入你的工作流,持续帮你省时间、减负担。

Codex 在这方面对我来说是成立的。

后来同事还跟我说,用 Medium 模式可以稍微省一些 token,而且生成出来的代码质量也基本够用。再往后,我就自己订阅了 Codex。虽然我是通过国内中转站的方式开的,但一个月 60 块左右,对我来说还在可接受范围内。

最开始那会儿,月卡每周有 180 刀额度,根本用不完。我当时甚至还想过,要不要去闲鱼"分享"几份,把月卡钱赚回来。后来中转站调整了几次额度,现在降到 60 刀,对于我来说刚好够用。

模型不是越新越好,关键还是看性价比

最近 Codex 又升级到了 GPT-5.5,我也切过去试了一下。

但就我自己的体感来说,编程质量并没有出现特别明显的提升,至少没有提升到让我愿意接受 token 消耗翻倍的程度。所以目前我还是继续用 5.4,原因也很简单:够用,而且性价比更高。

这其实也是我现在看待 AI 工具的一个习惯。很多时候,新版本、新模型、新功能听起来都很诱人,但最终还是要回到实际使用体验上:它到底有没有让我更省时间,还是只是让我多花了点成本、顺便多了一点新鲜感。

最近让我觉得实用的,是它开始"动手"了

除了写代码本身,Codex 这几个月还有一个让我印象比较深的变化,就是它开始具备更多"直接动手"的能力了。

比如自动控制浏览器去排查 bug,这对前端开发来说就挺实用。以前很多问题你要自己打开页面、点来点去、截图、描述,再让 AI 理解;现在有些场景下,它能直接自己去看、自己去试,沟通成本会低很多。

还有一点也挺方便,就是在某些场景里,它甚至不需要 MCP,就可以直接访问 Figma 去辅助还原设计图。对于前端来说,这类能力一旦稳定下来,实际价值还是挺高的。

AI 确实重构了我的工作方式

到现在为止,Codex 已经算是我日常开发里比较稳定的一部分了。它不是完美的,也不是所有事情都能处理得很好,但它已经足够帮我承担掉大量重复、基础、标准化的工作。

而这些工作一旦被压缩掉,开发者真正需要投入的,就更多变成了:

需求理解、结果验证、细节调整、问题判断,以及最后的兜底。

所以如果你问我,AI 编程到底值不值得用,我的答案是:值得。

但如果你问我,它是不是已经强到可以让程序员彻底躺平,那我的答案也是:还远远没有。

它更像是一个效率放大器。你本来就会做的事情,它能帮你做得更快;你本来就懂的东西,它能帮你省掉很多重复劳动;但那些真正需要经验、判断和责任心的部分,最后还是得你自己扛。

只不过,哪怕只是这样,也已经足够让我每天少干很多活了。

而这,某种程度上,可能就是 AI 编程目前最实在的价值。

相关推荐
人工智能AI技术1 小时前
【VibeCoding系列教程11】 AI智能体平台
人工智能
YOLO数据集集合1 小时前
智慧林业无人机巡检 松材线虫病害树木实例分割数据集 | 森林枯木识别 深度学习视觉
人工智能·深度学习·目标检测·计算机视觉·无人机
京东云开发者2 小时前
京东Taro Native框架静态布局直渲提速
前端
听你说322 小时前
深耕具身智能,亿达科创智能四足仿生机器人亮相沈阳机器人大会
人工智能·机器人
程序员小羊!2 小时前
03JavaScript预备知识
前端
前端的阶梯2 小时前
Cursor 开发 Python 项目完全指南
前端·人工智能·后端
Linlingu2 小时前
OpenClaw接入阿里云百炼模型配置教程(完整可落地)
人工智能·阿里云·云计算·办公自动化·数字员工·小龙虾
CTA量化套保2 小时前
Jupyter Notebook 反复运行天勤策略内存涨:close 与内核习惯
ide·人工智能·python·jupyter
艾伦野鸽ggg2 小时前
JavaScript 基础语法速通
前端·javascript