谁是最强编程大模型?横向对比GPT-5、GPT-5 Codex、Claude Sonnet 4.5、Gemini 2.5 Pro

先说结论:

编程能力:GPT-5 Codex > Claude Sonnet 4.5 > GPT-5 > Gemini 2.5 Pro

首先可以明确的是,四大模型给出的代码都没有bug,测试通过率都是100%,牛逼。

AI编程发展到如今这个程度,除了还需要人工配合外,其它的内容貌似都能干了。

程序员只负责使用AI辅助编程 + 抽烟摸鱼了。

GPT-5 Codex给出了解题思路与算法分析(包含问题本质、采用的数据结构和算法)、详细的Java 代码、详细的代码注释、对Java代码进行自测、测试用例及说明(包含边界用例)。

理由:

1、只有GPT-5 Codex对Java代码进行自测、给出了边界测试用例,小胜一筹。

2、Claude Sonnet 4.5作为Anthropic的最新旗舰模型,表现亮眼,但未给出边界测试用例,屈居第二。

3、GPT-5不是一次性完成,是通过多次连续提问,才给出了最后的答案,差评,但上下文较长,加分项。

4、Gemini 2.5 Pro没有明确表示对给出的代码进行自测、也未给出了边界测试用例。

国内直接使用GPT-5 Codex

谷歌浏览器访问:www.nezhasoft.cloud

私信哪吒,备注体验ai,领取体验码。

包含GPT-5、GPT-5 Thinking、GPT‑5 Codex、Sora2、Claude Sonnet 4.5、Gemini 2.5 Pro、Grok4、DeepSeek R1 0528等模型。

GPT-5 Codex

准确性:通过本地IDEA自测,通过率100%

GPT-5 Codex给出了解题思路与算法分析(包含问题本质、采用的数据结构和算法)、详细的Java 代码、详细的代码注释、对Java代码进行测试、测试用例及说明(包含边界用例)。

Claude Sonnet 4.5

准确性:通过本地IDEA自测,通过率100%

Claude Sonnet 4.5给出了解题思路与算法分析(包含问题本质、采用的数据结构和算法)、详细的Java 代码、详细的代码注释、测试用例及说明(不包含边界用例)。

GPT-5

准确性:通过本地IDEA自测,通过率100%

GPT-5给出了解题思路、算法步骤、详细的Java 代码、详细的代码注释、对Java代码进行自测、测试用例及说明(不包含边界用例)。

回答中没有明确表明:对Java代码测试用例自测。

Gemini 2.5 Pro

Gemini 2.5 Pro给出了解题思路与算法分析(包含问题本质、采用的数据结构和算法)、详细的Java 代码、详细的代码注释、测试用例及说明(不包含边界用例)。

往期精选:

如何用好 Codex?OpenAI 内部最佳实践指南:8 个最佳应用场景

Claude Sonnet 4.5发布,编程最强模型

重磅更新!满血GPT-5上线,全方位提升,很强

谷歌Gemini 2.5 Pro正式版,科技拯救牛马

相关推荐
许泽宇的技术分享4 小时前
百刀打造ChatGPT:nanochat极简LLM全栈实现深度解析
chatgpt·transformer·大语言模型·nanochat
飞哥数智坊6 小时前
Cursor 不设限:竟然直接支持 Claude Code 配置
ai编程·claude·cursor
小咕聊编程19 小时前
【含文档+PPT+源码】基于SpringBoot+Gpt个人健康管理系统
java·gpt·tomcat·毕业设计·hibernate
算家计算20 小时前
AI大神100美元手搓ChatGPT!nanochat教程爆火,4小时炼成聊天机器人
人工智能·chatgpt·资讯
Mr.Lee jack21 小时前
体验GPT-OSS-120B:在PH8平台上探索超大规模语言模型的强大能力
人工智能·gpt·语言模型·openai·deepseek
量子位21 小时前
别Claude Code了,一个国产免费命令行就够了
claude
哪吒编程1 天前
如何用好 Codex?OpenAI 内部最佳实践指南:8 个最佳应用场景
gpt·openai
CoderLemon1 天前
告别重复编码:Claude Code 自动化开发全流程详解——启航篇-00
人工智能·claude
yaocheng的ai分身2 天前
claude code 插件市场
ai编程·claude