这个月不管是工作中还是在闲暇时分,都在大量使用 AI 来完成编程任务。这篇文章主要从模型 和工具两个方面来分享一下三金在实际应用中的一些经验和踩坑。
模型
首先要说的就是模型 ,因为这玩意儿就跟人的智商一样,智商的高低决定了 AI Coding 的结果上限。
从我使用过的模型来看,主要分为两类:付费 和开源。
在付费模型中,被大家耳熟能详的就是 Claude、GPT5 和 Gemini 2.5 Pro。它们的实力也毋庸置疑,在使用相同 AI 工具的情况下,付费模型产出的结果质量就是优于免费模型。
而这三个模型的能力排名,以我个人的观点,依次是:Claude -> GPT5 -> Gemini 2.5 Pro。
没错,Claude 模型在我心中依旧是无冕之王。
它在代码质量、可处理的项目规模大小、工程化等维度,还是优于后面两者。其实 GPT5 现在也非常 OK,在编码能力上和 Claude 的差距已经被追的很小,所以也有小伙伴会觉得 GPT5 优于 Claude。
不过这个仁者见仁、智者见智,除了模型之外,工具和提示词在其中也占据了大部分影响因素,三金更推荐大家同时使用它们进行协同开发,效果更加显著。
而在开源模型中,GLM 4.6 是当今的佼佼者,其次是 Kimi K2、DeepSeek V3 系列、Qwen3 Coder Plus 以及最近 MiniMax 刚出的 M2。
这几款模型三金都有尝试过进行 AI Coding,而最终产物给我的感觉就是------能跑,但不能细看 ,属于非常"优秀"的防御性代码开发选手。应对中小型应用开发来说绰绰有余,开发复杂的大型项目,会让人恨不得给"它们"两拳。
综上,在有能力和渠道的情况下,我优先使用 Claude 4.5 和 Claude 4,其次是 GPT5。若渠道无法使用这些模型的情况下,会优先使用 GLM 4.6。
给大家推两个非常好用的免费站点,有提供 Claude 模型和 GPT5 模型。分别是:
AgentRouter:agentrouter.org/register?af...
AnyRouter:anyrouter.top/register?af...
工具
说完模型之后接下来就是工具,上面说到智商决定了 AI Coding 的结果上限,那么工具就决定了 AI Coding 的效率和质量上限。
这个月主要在用的四款 AI Coding 工具,分别是 Claude Code、Codex、IFlow 和 Qoder。
其中:
- Claude Code 就是 Claude 模型它们家出的,名字也是配套的;
- Codex 是 OpenAI 出的终端 CLI 工具,搭配 GPT5 也非常好用!
- IFlow 是阿里心流团队推出的产品,最大的亮点就是内置的模型全是免费的!!目前支持 GLM 4.6、MiniMax M2、Qwen3-Coder 等模型;
- Qoder 也是阿里的产品,今年 8 月面世,它还是通义灵码的原班人马打造的。好多人疑惑阿里怎么搞了这么多 AI Coding 的工具,我个人理解 IFlow 和通义灵码的受众群体是面向国内开发人员,而 Qoder 则是面向海外或者全球开发者。
我先使用 Qoder 的 Quest 模式 搭建了一个初版的项目架子,它是通过我提交的一份我自认为详细的 PRD,从需求详细设计、任务拆分到前后端代码搭建完全一条龙。
让我感到惊奇的是,这套代码竟然真的能跑起来!它可不单单是前端跑前端、后端跑后端,而是前后端接口联调都搞好了 ,不止如此,还搭配了 Docker 容器化。真的超出了我的预期,非常赞!
不过这个模式也非常吃 Credits,一套组合拳下来,我的 2000 Credits 已经告罄,犹豫了一会儿,先转战到了 Claude Code(使用 AgentRouter 和 AnyRouter 中转)。
Claude Code 是 CLI AI 编码模式的鼻祖,迭代到 2.x 版本之后配合 Claude 模型也是"一派宗师"的存在。更别说 MCP、SubAgent 以及 Spec Kit 这些,直接让 Claude Code 如虎添翼,在它的帮助下我很快便完善了项目上的各种细节和漏洞,各个功能也逐渐达到了预期的状态,整体逐步向可发布生产的标准推进。
然!天有不测风云,Claude 他们又开始大规模封号针对中国用户,导致那段时间 Claude 模型不可用,不得已之下我转而使用 Codex 搭配 GPT5 来继续推荐项目进度。
说实话,尽管 Codex 的热度和 Claude Code 不相上下,但在这之前我是没有使用过 Codex 的,抱着试一试的心态,我配置好了 Codex 以及 GPT5 High 开始进行小范围测试。以下是我使用 Codex 的一些感受:
- 慢 !!在 Codex 中有个配置叫 model_reasoning_effort ,用来配置模型的推理力度 ,支持 低(low)、中(medium)和高(high),前期不知情的情况下一直设置的是 High,既慢又费 token。但效果也是没得说,这种状态下的它,就像一个经验非常丰富的架构师,会给出一些非常有建设性意义的结论!
- 如果降低模型的推理力度,你会感觉虽然速度快了,但是代码产出质量实打实的下降了,完全不及 Claude。
- 改代码时直接就给你改掉了,也不问你同不同意。
- 配置项不像其他 AI CLI 那样使用 JSON 或者环境变量进行设置,而是 TOML 格式,写习惯 JSON 之后突然有些不适应,尤其是如果要配置 MCP 还需要注意转义之类的。
所以后期我就搭配 Claude Code (后面服务又恢复了)和 Codex GPT5 High 一起使用,Codex 作为架构师负责出方案和设计,Claude Code 做一线研发,根据方案和设计进行产出,效果杠杠的,项目进度直接干到 98%。
现在就剩下一些样式优化我会用 Iflow 来做,不过需要提前进行样式定制,不然按照 AI 自己独有的品味,出来的样式可能会有一些赛博朋克。
iflow 这个产品,别的不说,就免费这一点,真的很值得大家去尝试一下。而且背靠大厂,在行为模式上又和 Claude Code 看齐,我实在想不出有什么理由能拒绝它,除非你的代码严格保密!