没想到,同样是技术方案Review,Gemini 是这样,Codex却是。。。

背景

有个前端页面是AI生成的,十分臃肿,大概页面useState有十几个,行数一千行的样子(只是根组件),还有很多子组件。准备重构它。当然自己动手重构那是不可能的,还是交给AI来做

Claude Code 分析代码、产出重构文档

首先我还是让 Claude Code阅读代码,给我一个重构文档,我的prompt大概是这样的:

diff 复制代码
这个页面太复杂了, app/dashboard/page, 通读代码给我一个重构方案。

重构要遵循
- 单一原则
- 组件分层要清楚,分清楚是渲染组件还是容器等组件
- 公共组件封装
- 重复逻辑hook复用
- 可扩展,可维护。
- 等等

然后Claude Code就开始一顿操作了,最后产出了一份技术文档,嗯,确实很全,接近一千七百行

问题来了,这么长的文档也看不过来啊,主要还是不想看,那就交给AI吧。

Gemini 小试牛刀

首先出场的gemini-pro-2.5, 我在Gemini cli中让它review技术文档,我是这样提问的:

@docs/prd/FE_refactor_prd.md 我已经根据需求v1.0.2,完成了技术方案 @docs/tech/refactor/FE-refactor-dashboard-v1.0.2, 通读相关的代码,review我的技术文档是否有问题

我的天,Gemini几乎是秒回答的,它是这样回答的

好吧,我只看到了吹嘘,没看到任何有用的结果。我不甘心接着问:

你阅读相关代码了吗? 就做这个评价

这回它开始读代码了,但是时间也很快就给我答复了

呃,好吧,你是最棒的

智谱 glm-4.6 跃跃欲试

最近比较火智谱glm-4.6, 号称模型接近sonnet 4.0,让它也来试试。 我在Claude Code中使用智谱 glm-4.6, 同样的提示词:

@docs/prd/FE_refactor_prd.md 我已经根据需求v1.0.2,完成了技术方案 @docs/tech/refactor/FE-refactor-dashboard-v1.0.2, 通读相关的代码,review我的技术文档是否有问题

这是它的回答:

中规中矩吧,还不错,也认真读了现有的代码。总结了很多,也提出了一些问题。其他的也是一些表扬的话

Codex 低调登场

接着我用Codex,使用的模型是gpt-5-doex 的Medium,同样的提示词:

@docs/prd/FE_refactor_prd.md 我已经根据需求v1.0.2,完成了技术方案 @docs/tech/refactor/FE-refactor-dashboard-v1.0.2, 通读相关的代码,review我的技术文档是否有问题,中文回答

在思考了4分钟后,它给出了答案

简洁明了,没有任何恭维的话,直接列出问题

总结

gemini-2.5-pro令人失望,没有什么有价值的东西,就是一顿吹嘘。glm-4.6还行,中规中矩,谈不上出色。最后还是得Codex啊,结论中肯有用,没有额外花里胡哨的话

相关推荐
麦麦麦造8 小时前
Cursor 2.0碉堡了的新模型,竟然基于国产模型开发?
ai编程
清沫8 小时前
规训 AI Agent 实践
前端·ai编程·cursor
花生Peadar17 小时前
完整的AI编程全自动指南
ai编程
coder_pig21 小时前
【独家实测】Cursor 2.0 发布,花一分钟看看都更新了啥
aigc·ai编程·cursor
木昆子1 天前
大模型流式输出:七大底层传输技术对比探究
人工智能·http·ai编程
烨瑾焕1 天前
Cursor Rules 编写实践:从抽象原则到可执行指令
ai编程
trsoliu1 天前
AI辅助编程:从代码生成到实际落地的思考
ai编程
AI产品自由1 天前
爽!AI编程2年半,终于用上了喂饭级的API!
ai编程
谁用了我的idea1 天前
如何使用大模型提升开发能力与效率(核心知识点)
ai编程