选择gpt-5还是claude-4-sonnect

了解我的朋友都知道,我是一个伪全栈工程师,一个人加AI编程工具打天下。

最近,gpt-5已经出来有一段时间了,cursor第一时间就支持了gpt-5模型,我第一时间就尝试了gpt-5效果。说实话,gpt-5和claude-4-sonnect都是AI领域顶尖的编程模型,确实很难抉择。以下是我在Cursor场景下,对这2款模型的编程表现做的一些实测。

前端开发的表现

前端在使用Figma+MCP的场景下,让两者去还原设计稿的对比。

提示词如下:

less 复制代码
在@ChangeInsured.vue里,严格还原这个设计稿 @https://www.figma.com/design/SJ8lFhFbWsMePFLHbuPnER/xxxxxxxxxx?node-id=2364-703&m=dev,
底部的保存按钮采用主题色,跟@index.vue里的"支付按钮"的主题色一样。

claude-4-sonnect效果

gpt-5效果

通过效果对比可以看出,两者的效果都挺好的,但是都不够完美,不过,通过再一次的对话给AI问题所在,他们都能完美解决。

有一点值得注意,我的主题色是蓝色,很显然,gpt-5 get到了我给他的注意点,但是claude只是还原了设计稿的颜色。gpt-5只是在2个图标显示上设计的有些问题,其余表现都是不错的。

反观claude-4-sonnect,没有get到我的主题色,页面的尺寸设计也有些问题。

这一局,我觉得gpt-5略胜一些。

代码解释的表现

代码解释方便就是仁者见仁了,通过我这些天的尝试,gpt-5和claude-4-sonnect在代码解释方面做的都很到位。对于不太熟悉的领域里的代码,他俩都是一次性就给你讲清楚。

偶尔,claude-4-sonnect讲的会更细致一些吧,但也不是绝对。

这一局,我觉得他俩算平手。

速度上的表现

通过我的使用观测,cursor里的gpt-5在响应速度上会比claude-4-sonnect慢一些。但是,这不代表gpt-5慢哦,在chatgpt官网使用gpt-5,他处理任务的速度是非常快的。

这一局,我觉得claude-4-sonnect略胜一些。

其余编程领域的表现

后端领域,比如Java,我基本都是让他俩根据表结构生成controller、service、dao层的代码,表现都很好。

Python领域里,我让他俩开发一个移除图片上的水印文字的功能,gpt-5做的更好一些。然后,又让他俩使用pytorch识别手写数字的功能,从数据准备、搭建网络、模型训练、模型测试、模型预测的效果来看,claude-4-sonnect做的稍微好一些。

这一局,我觉得他俩算平手。

复杂任务的表现

正常情况下,我们想让AI出色的完成任务,最好每次只让他聚焦完成一两项任务即可。这次我测试了让AI一次性完成7项任务。

从测试的情况下,claude-4-sonnect会先做计划列出todolist,然后一项项去思考和完成。而gpt-5先思考很长时间做好各个任务的规划,然后快速去实现,不会列出todo。不过gpt-5在复杂任务的场景下虽然没做todolist,反而完成的更好些。

可见GPT-5 这一波还是很靠谱的,改进了对复杂指令的理解和执行能力。

这一局,我觉得gpt-5略胜一些。

总结

总之,不管选择谁都可以帮你出色的完成任务。可能有的朋友会觉得,我写了一堆废话还是没分出个胜负。

但是我想说的是,两者都是行业里顶尖大模型,在编程领域确实不分伯仲。考虑到gpt-5目前免费,claude-4-sonnect在cursor里有额度限制,我给出几点建议:

  1. 一般性不负责的问题,选择cursor的auto模式。既免费速度又快。
  2. 复杂的问题,优先使用gpt-5,因为它目前gpt-5免费而且效果又好,只是速度慢了些。从目前实测的表现来看,大概率是能完成你的任务。
  3. 如果gpt-5做的不理想,继续使用claude-4-sonnect试试,可能会有更好的效果,可能也会没有。
  4. 如果想一直使用claude-4-sonnect或者是重度使用claude-4-sonnect的朋友,建议买2个学生号换着用。根据官方的说明,学生号在功能上没做任何阉割,只是免费了一年。

如果还有其余问题,欢迎 加V 沟通。

======>>>>>> 关于我 <<<<<<======

本篇完结!欢迎点赞 关注 收藏!!!

相关推荐
文弱_书生13 分钟前
为什么神经网络的权重矩阵具有低秩特性?如何理解和解释?
人工智能·神经网络·矩阵
Bar_artist14 分钟前
微软推出革命性AI安全工具Project IRE,重塑网络安全防御新范式
人工智能·安全·microsoft
cver1231 小时前
人脸情绪检测数据集-9,400 张图片 智能客服系统 在线教育平台 心理健康监测 人机交互优化 市场研究与广告 安全监控系统
人工智能·安全·yolo·计算机视觉·目标跟踪·机器人·人机交互
技术老金1 小时前
LangGraph入门与避坑指南:从ReAct到复杂流程编排
人工智能·python
大佬喝可乐1 小时前
卷积神经网络(CNN)全面解析
人工智能·神经网络·cnn
martinzh1 小时前
上下文学习的神奇魔法:轻松理解AI如何无师自通
人工智能
Hcoco_me1 小时前
【4】Transformers快速入门:自然语言模型 vs 统计语言模型
人工智能·语言模型·自然语言处理
机器之心2 小时前
Agent狂欢下的冷思考:为什么说Data&AI数据基础设施,才是AI时代Infra新范式
人工智能·openai
算家计算2 小时前
阿里开源首个图像生成基础模型——Qwen-Image本地部署教程,超强中文渲染能力刷新SOTA!
人工智能·开源·aigc