谁是最强编程大模型?横向对比GPT-5、GPT-5 Codex、Claude Sonnet 4.5、Gemini 2.5 Pro

先说结论:

编程能力:GPT-5 Codex > Claude Sonnet 4.5 > GPT-5 > Gemini 2.5 Pro

首先可以明确的是,四大模型给出的代码都没有bug,测试通过率都是100%,牛逼。

AI编程发展到如今这个程度,除了还需要人工配合外,其它的内容貌似都能干了。

程序员只负责使用AI辅助编程 + 抽烟摸鱼了。

GPT-5 Codex给出了解题思路与算法分析(包含问题本质、采用的数据结构和算法)、详细的Java 代码、详细的代码注释、对Java代码进行自测、测试用例及说明(包含边界用例)。

理由:

1、只有GPT-5 Codex对Java代码进行自测、给出了边界测试用例,小胜一筹。

2、Claude Sonnet 4.5作为Anthropic的最新旗舰模型,表现亮眼,但未给出边界测试用例,屈居第二。

3、GPT-5不是一次性完成,是通过多次连续提问,才给出了最后的答案,差评,但上下文较长,加分项。

4、Gemini 2.5 Pro没有明确表示对给出的代码进行自测、也未给出了边界测试用例。

国内直接使用GPT-5 Codex

谷歌浏览器访问:www.nezhasoft.cloud

私信哪吒,备注体验ai,领取体验码。

包含GPT-5、GPT-5 Thinking、GPT‑5 Codex、Sora2、Claude Sonnet 4.5、Gemini 2.5 Pro、Grok4、DeepSeek R1 0528等模型。

GPT-5 Codex

准确性:通过本地IDEA自测,通过率100%

GPT-5 Codex给出了解题思路与算法分析(包含问题本质、采用的数据结构和算法)、详细的Java 代码、详细的代码注释、对Java代码进行测试、测试用例及说明(包含边界用例)。

Claude Sonnet 4.5

准确性:通过本地IDEA自测,通过率100%

Claude Sonnet 4.5给出了解题思路与算法分析(包含问题本质、采用的数据结构和算法)、详细的Java 代码、详细的代码注释、测试用例及说明(不包含边界用例)。

GPT-5

准确性:通过本地IDEA自测,通过率100%

GPT-5给出了解题思路、算法步骤、详细的Java 代码、详细的代码注释、对Java代码进行自测、测试用例及说明(不包含边界用例)。

回答中没有明确表明:对Java代码测试用例自测。

Gemini 2.5 Pro

Gemini 2.5 Pro给出了解题思路与算法分析(包含问题本质、采用的数据结构和算法)、详细的Java 代码、详细的代码注释、测试用例及说明(不包含边界用例)。

往期精选:

如何用好 Codex?OpenAI 内部最佳实践指南:8 个最佳应用场景

Claude Sonnet 4.5发布,编程最强模型

重磅更新!满血GPT-5上线,全方位提升,很强

谷歌Gemini 2.5 Pro正式版,科技拯救牛马

相关推荐
程序员佳佳7 小时前
【万字硬核】从零构建企业级AI中台:基于Vector Engine整合GPT-5.2、Sora2与Veo3的落地实践指南
人工智能·gpt·chatgpt·ai作画·aigc·api·ai编程
AI首席情报员_阿布10 小时前
Claude Skills vs MCP:区别与实战指南
claude
sinat_2869451912 小时前
opencode
人工智能·算法·chatgpt
Miku1613 小时前
使用 Claude Code 的 pptx-skills 技能生成精美 EVA 主题 PPT 完整指南
aigc·agent·claude
甲维斯14 小时前
Claude Code 第三篇:SKILL技能入门和实战!
claude
Blossom.11819 小时前
大模型自动化压缩:基于权重共享的超网神经架构搜索实战
运维·人工智能·python·算法·chatgpt·架构·自动化
开发者导航19 小时前
【开发者导航】ChatGPT Atlas 开源平替,一款免费的AI浏览器,让网页自动驾驶!
人工智能·chatgpt
悟道心19 小时前
8. 自然语言处理NLP -GPT
人工智能·gpt·自然语言处理
IT 行者20 小时前
Claude之父AI编程技巧一:并行终端 + 系统通知——将Claude Code变成你的超级开发团队
ai编程·claude
yaocheng的ai分身1 天前
【anthropic官方文章】揭秘 AI Agents 的评估方法
claude