选择gpt-5还是claude-4-sonnect

了解我的朋友都知道,我是一个伪全栈工程师,一个人加AI编程工具打天下。

最近,gpt-5已经出来有一段时间了,cursor第一时间就支持了gpt-5模型,我第一时间就尝试了gpt-5效果。说实话,gpt-5和claude-4-sonnect都是AI领域顶尖的编程模型,确实很难抉择。以下是我在Cursor场景下,对这2款模型的编程表现做的一些实测。

前端开发的表现

前端在使用Figma+MCP的场景下,让两者去还原设计稿的对比。

提示词如下:

less 复制代码
在@ChangeInsured.vue里,严格还原这个设计稿 @https://www.figma.com/design/SJ8lFhFbWsMePFLHbuPnER/xxxxxxxxxx?node-id=2364-703&m=dev,
底部的保存按钮采用主题色,跟@index.vue里的"支付按钮"的主题色一样。

claude-4-sonnect效果

gpt-5效果

通过效果对比可以看出,两者的效果都挺好的,但是都不够完美,不过,通过再一次的对话给AI问题所在,他们都能完美解决。

有一点值得注意,我的主题色是蓝色,很显然,gpt-5 get到了我给他的注意点,但是claude只是还原了设计稿的颜色。gpt-5只是在2个图标显示上设计的有些问题,其余表现都是不错的。

反观claude-4-sonnect,没有get到我的主题色,页面的尺寸设计也有些问题。

这一局,我觉得gpt-5略胜一些。

代码解释的表现

代码解释方便就是仁者见仁了,通过我这些天的尝试,gpt-5和claude-4-sonnect在代码解释方面做的都很到位。对于不太熟悉的领域里的代码,他俩都是一次性就给你讲清楚。

偶尔,claude-4-sonnect讲的会更细致一些吧,但也不是绝对。

这一局,我觉得他俩算平手。

速度上的表现

通过我的使用观测,cursor里的gpt-5在响应速度上会比claude-4-sonnect慢一些。但是,这不代表gpt-5慢哦,在chatgpt官网使用gpt-5,他处理任务的速度是非常快的。

这一局,我觉得claude-4-sonnect略胜一些。

其余编程领域的表现

后端领域,比如Java,我基本都是让他俩根据表结构生成controller、service、dao层的代码,表现都很好。

Python领域里,我让他俩开发一个移除图片上的水印文字的功能,gpt-5做的更好一些。然后,又让他俩使用pytorch识别手写数字的功能,从数据准备、搭建网络、模型训练、模型测试、模型预测的效果来看,claude-4-sonnect做的稍微好一些。

这一局,我觉得他俩算平手。

复杂任务的表现

正常情况下,我们想让AI出色的完成任务,最好每次只让他聚焦完成一两项任务即可。这次我测试了让AI一次性完成7项任务。

从测试的情况下,claude-4-sonnect会先做计划列出todolist,然后一项项去思考和完成。而gpt-5先思考很长时间做好各个任务的规划,然后快速去实现,不会列出todo。不过gpt-5在复杂任务的场景下虽然没做todolist,反而完成的更好些。

可见GPT-5 这一波还是很靠谱的,改进了对复杂指令的理解和执行能力。

这一局,我觉得gpt-5略胜一些。

总结

总之,不管选择谁都可以帮你出色的完成任务。可能有的朋友会觉得,我写了一堆废话还是没分出个胜负。

但是我想说的是,两者都是行业里顶尖大模型,在编程领域确实不分伯仲。考虑到gpt-5目前免费,claude-4-sonnect在cursor里有额度限制,我给出几点建议:

  1. 一般性不负责的问题,选择cursor的auto模式。既免费速度又快。
  2. 复杂的问题,优先使用gpt-5,因为它目前gpt-5免费而且效果又好,只是速度慢了些。从目前实测的表现来看,大概率是能完成你的任务。
  3. 如果gpt-5做的不理想,继续使用claude-4-sonnect试试,可能会有更好的效果,可能也会没有。
  4. 如果想一直使用claude-4-sonnect或者是重度使用claude-4-sonnect的朋友,建议买2个学生号换着用。根据官方的说明,学生号在功能上没做任何阉割,只是免费了一年。

如果还有其余问题,欢迎 加V 沟通。

======>>>>>> 关于我 <<<<<<======

本篇完结!欢迎点赞 关注 收藏!!!

相关推荐
罗西的思考2 分钟前
【OpenClaw】通过Nanobot源码学习架构---(2)外层控制逻辑
人工智能·机器学习
火山引擎开发者社区12 分钟前
明天武汉!用好“龙虾”的关键要素全在这儿
人工智能
梦想很大很大13 分钟前
从 0 到 1 实现 AI Agent(02):设计可扩展的 Tool 调用系统
人工智能·llm·agent
木斯佳15 分钟前
HarmonyOS 6实战:AI时代的“信任危机“,如何处理应用的请求拦截与安全防护
人工智能·安全·harmonyos
jkyy201416 分钟前
食物识别与卡路里估算技术:以视觉技术重构膳食健康管理新范式
人工智能·语言模型·自动化·健康医疗
冬奇Lab25 分钟前
一天一个开源项目(第61篇):knowledge_graph - 把任意文本转成知识图谱
人工智能·llm
wdf808830 分钟前
算力随行:UltraLAB便携工作站如何将多卡深度学习带入户外与现场
人工智能·深度学习·大模型推理·无人机影像
Datacarts1 小时前
AI大模型时代:微店商品数据API如何重构反向海淘决策
大数据·人工智能·重构
ws2019071 小时前
技术交流与商贸融合,2026广州汽车测试测量展释放产业协同新动能
大数据·人工智能·科技·汽车
智算菩萨1 小时前
【论文复现】Applied Intelligence 2025:Auto-PU正例无标签学习的自动化实现与GPT-5.4辅助编程实战
论文阅读·python·gpt·学习·自动化·复现