谁是最强编程大模型?横向对比GPT-5、GPT-5 Codex、Claude Sonnet 4.5、Gemini 2.5 Pro

先说结论:

编程能力:GPT-5 Codex > Claude Sonnet 4.5 > GPT-5 > Gemini 2.5 Pro

首先可以明确的是,四大模型给出的代码都没有bug,测试通过率都是100%,牛逼。

AI编程发展到如今这个程度,除了还需要人工配合外,其它的内容貌似都能干了。

程序员只负责使用AI辅助编程 + 抽烟摸鱼了。

GPT-5 Codex给出了解题思路与算法分析(包含问题本质、采用的数据结构和算法)、详细的Java 代码、详细的代码注释、对Java代码进行自测、测试用例及说明(包含边界用例)。

理由:

1、只有GPT-5 Codex对Java代码进行自测、给出了边界测试用例,小胜一筹。

2、Claude Sonnet 4.5作为Anthropic的最新旗舰模型,表现亮眼,但未给出边界测试用例,屈居第二。

3、GPT-5不是一次性完成,是通过多次连续提问,才给出了最后的答案,差评,但上下文较长,加分项。

4、Gemini 2.5 Pro没有明确表示对给出的代码进行自测、也未给出了边界测试用例。

国内直接使用GPT-5 Codex

谷歌浏览器访问:www.nezhasoft.cloud

私信哪吒,备注体验ai,领取体验码。

包含GPT-5、GPT-5 Thinking、GPT‑5 Codex、Sora2、Claude Sonnet 4.5、Gemini 2.5 Pro、Grok4、DeepSeek R1 0528等模型。

GPT-5 Codex

准确性:通过本地IDEA自测,通过率100%

GPT-5 Codex给出了解题思路与算法分析(包含问题本质、采用的数据结构和算法)、详细的Java 代码、详细的代码注释、对Java代码进行测试、测试用例及说明(包含边界用例)。

Claude Sonnet 4.5

准确性:通过本地IDEA自测,通过率100%

Claude Sonnet 4.5给出了解题思路与算法分析(包含问题本质、采用的数据结构和算法)、详细的Java 代码、详细的代码注释、测试用例及说明(不包含边界用例)。

GPT-5

准确性:通过本地IDEA自测,通过率100%

GPT-5给出了解题思路、算法步骤、详细的Java 代码、详细的代码注释、对Java代码进行自测、测试用例及说明(不包含边界用例)。

回答中没有明确表明:对Java代码测试用例自测。

Gemini 2.5 Pro

Gemini 2.5 Pro给出了解题思路与算法分析(包含问题本质、采用的数据结构和算法)、详细的Java 代码、详细的代码注释、测试用例及说明(不包含边界用例)。

往期精选:

如何用好 Codex?OpenAI 内部最佳实践指南:8 个最佳应用场景

Claude Sonnet 4.5发布,编程最强模型

重磅更新!满血GPT-5上线,全方位提升,很强

谷歌Gemini 2.5 Pro正式版,科技拯救牛马

相关推荐
Mintopia6 小时前
🧩 Claude Code Hooks 最佳实践指南
人工智能·claude·全栈
世洋Blog13 小时前
更好的利用ChatGPT进行项目的开发
人工智能·unity·chatgpt
win4r19 小时前
昨夜炸场!Claude Opus 4.5 发布,Chrome 插件“夺舍”浏览器,实测这7大功能令人头皮发麻
aigc·openai·claude
wavemap21 小时前
先到先得:免费订阅一年ChatGPT Go会员
开发语言·chatgpt·golang
带刺的坐椅1 天前
(让 Java IA & MCP 更简单 )Solon AI v3.7.2 发布
ai·chatgpt·openai·solon·mcp
算家计算1 天前
编程AI新王Claude Opus 4.5正式发布!编程基准突破80.9%,成本降三分之二
人工智能·ai编程·claude
波尔德1 天前
GPT是否降智的测试问题
gpt
量子位1 天前
Nano Banana新玩法无限套娃!“GPT-5都不会处理这种级别的递归”
人工智能·gpt
撒币使我快乐1 天前
Claude Code + Cursor编程环境初始化
claude·cursor