背景
有个前端页面是AI生成的,十分臃肿,大概页面useState有十几个,行数一千行的样子(只是根组件),还有很多子组件。准备重构它。当然自己动手重构那是不可能的,还是交给AI来做
Claude Code 分析代码、产出重构文档
首先我还是让 Claude Code阅读代码,给我一个重构文档,我的prompt大概是这样的:
diff
这个页面太复杂了, app/dashboard/page, 通读代码给我一个重构方案。
重构要遵循
- 单一原则
- 组件分层要清楚,分清楚是渲染组件还是容器等组件
- 公共组件封装
- 重复逻辑hook复用
- 可扩展,可维护。
- 等等
然后Claude Code就开始一顿操作了,最后产出了一份技术文档,嗯,确实很全,接近一千七百行

问题来了,这么长的文档也看不过来啊,主要还是不想看,那就交给AI吧。
Gemini 小试牛刀
首先出场的gemini-pro-2.5, 我在Gemini cli中让它review技术文档,我是这样提问的:
@docs/prd/FE_refactor_prd.md 我已经根据需求v1.0.2,完成了技术方案 @docs/tech/refactor/FE-refactor-dashboard-v1.0.2, 通读相关的代码,review我的技术文档是否有问题
我的天,Gemini几乎是秒回答的,它是这样回答的

好吧,我只看到了吹嘘,没看到任何有用的结果。我不甘心接着问:
你阅读相关代码了吗? 就做这个评价
这回它开始读代码了,但是时间也很快就给我答复了

呃,好吧,你是最棒的
智谱 glm-4.6 跃跃欲试
最近比较火智谱glm-4.6, 号称模型接近sonnet 4.0,让它也来试试。 我在Claude Code中使用智谱 glm-4.6, 同样的提示词:
@docs/prd/FE_refactor_prd.md 我已经根据需求v1.0.2,完成了技术方案 @docs/tech/refactor/FE-refactor-dashboard-v1.0.2, 通读相关的代码,review我的技术文档是否有问题
这是它的回答:

中规中矩吧,还不错,也认真读了现有的代码。总结了很多,也提出了一些问题。其他的也是一些表扬的话
Codex 低调登场
接着我用Codex,使用的模型是gpt-5-doex 的Medium,同样的提示词:
@docs/prd/FE_refactor_prd.md 我已经根据需求v1.0.2,完成了技术方案 @docs/tech/refactor/FE-refactor-dashboard-v1.0.2, 通读相关的代码,review我的技术文档是否有问题,中文回答
在思考了4分钟后,它给出了答案

简洁明了,没有任何恭维的话,直接列出问题
总结
gemini-2.5-pro令人失望,没有什么有价值的东西,就是一顿吹嘘。glm-4.6还行,中规中矩,谈不上出色。最后还是得Codex啊,结论中肯有用,没有额外花里胡哨的话