GPT5写5000行代码,行不行?

GPT5干活扭捏,甚至还想催我搬砖。

一、简介

这几天,试过用国内几款大模型写代码:DeepSeek、Kimi、千问、智谱清言。

测试中最复杂的问题是这样:

使用前端编程语言,开发一款复杂的Web网站,涉及大模型信息采集和展示;进行数据分析,给用户提供有价值的参考;做一个社区板块,可以交流各种模型的使用案例;总共分为3个模块,每个模块都要填充一定的模拟数据,并且支持全站检索功能;视觉追求创意和科技感;考虑问题的复杂性,需要先设计工程架构再编写代码。代码输出5000行左右,完整的放在一个html文件中,可以直接预览。

最终,几款大模型都没有达到5000行的要求,但是会输出它们各自能达到的最大行数,并且呈现的页面效果也算ok。

上周,GPT5发布了,于是带着这个老问题,让GPT5也试试5000行的代码。

先说结论:GPT5虽能以顶尖代码能力输出完整成果,但需动态调整资源以维持长序列生成的稳定性。

二、编码测试过程

测试在Augment插件中,使用的GPT-5模型

以下是Prompt提示词;

用html5和css3,在当前项目中,写一个创意科技风的网站,内容是AI相关信息,输出大概5000行代码

它并不会像之前的AI模型一样,直接输出,而是会给出一个提纲,让开发者来确认是否可行。

我只想让它测一个demo,看看它输出的能力边界。对于内容没有任何思路,想全靠它自由发挥,我觉得这种提纲和确认是有点"多余"的。以下是它给出的提纲摘要:

...

请确认以下选项:

  • 站点语言:中文为主可以吗?
  • 主题风格:霓虹/赛博朋克 + 玻璃拟态(半透明+毛玻璃)+ 渐变背景,可以?
  • 站点结构(多页):主页、关于 AI、应用场景、研究与论文、新闻/趋势、伦理与安全、术语表、资源与工具、画廊(CSS 动效展示)、联系我们。OK?
  • 是否需要包含任何交互?你要求仅 HTML+CSS,我会用纯 CSS 的动画与"checkbox hack"实现导航展开、FAQ 折叠等,不用 JS,可以吗?
  • 颜色偏好:蓝紫青高对比(科技感)可以吗?或告诉我你的主色值(如 #7C3AED 紫、#06B6D4 青等)

确认后我将:

  1. ...
  2. ...
  3. ....
  4. ....

请回复你的偏好(尤其是颜色与是否中文),我就开始落地实现并生成文件。

其中这种完全可以在执行过程中输出,告知开发者它选择的风格和色调等关键信息。这种情况在Claude Sonnet 4模型中就不会出现。

待我确认好信息后,它开始干活。首先它会告诉我:

我将分多步创建多页静态站点与样式文件,确保每个文件在300行以内但总体约5000行。先搭好样式与共享结构,再逐页填充内容。开始创建样式文件。

开始就会给此次任务定了整体的基调:分批执行。

会话执行完毕后,会在最后总结,1、已完成内容 。2、下一步执行计划 。3、**需要开发者确认的信息(针对下一步的输出)。**不过,第三步有时候也不会输出,可能它自己替我做了决定吧。

于是,从上午9点左右,到下午1点多,经过了15轮拉扯,它终于完整输出了这个demo。效果尚可,点击顺畅,除了一些样式细节需要优化,没有明显的bug。

下面是最终输出的部分效果图;

总体来说:GPT-5智能提升多少很难说,相信后面更深度的体验才能感受到它的优缺点。从目前的感受而已,很有主动性,积极建议下一步动作,感觉多了一个催我干活的队友

三、写在最后

对比国内的大模型而言,GPT-5它会抓住核心的需求:5000行,并且贯彻地执行下去,最终给出的结果也是过关的。而不是选择降级,弱化需求输出结果。

如果是真正的需求,相信它也会实打实给出自己的思路,行就是行,不行也得解释原因。(后面会深度体验一把用GPT-5做真实的项目开发)。

plain 复制代码
模型测评Git仓库
https://gitee.com/t_qhl/model-chaos

知识归档Git仓库
https://gitee.com/cicadasmile/butte-java-note
相关推荐
程序员码歌2 小时前
零代码AI编程实战-热搜从0到1技术方案
前端·ai编程·cursor
GitLqr2 小时前
AI洞察 | Hunyuan-MT 翻译模型开源,谷歌终端嵌入模型登场
github·ai编程·gemini
落小小4 小时前
Qoder如何免费续杯,立即参与实践分享,赢 1000Credits
ai编程·cursor
花生糖@5 小时前
GPT-5发布:统一智能体时代的开启——从“工具”到“协作者”的范式跃迁
gpt·ai·gpt5
X.Cristiano5 小时前
OpenAI新论文:Why Language Models Hallucinate
llm·openai·幻觉
蜗牛快跑1237 小时前
拆巨资让 Claude Code 和 Codex 同时住进了我的终端里
前端·后端·ai编程
用户4099322502127 小时前
多环境配置切换机制能否让开发与生产无缝衔接?
后端·ai编程·trae
迦蓝叶8 小时前
JAiRouter 配置文件重构纪实 ——基于单一职责原则的模块化拆分与内聚性提升
java·网关·ai·重构·openai·prometheus·单一职责原则
工藤学编程1 天前
【AI编程工具】快速搭建图书管理系统
ai编程
原住民的自修室1 天前
对话Michael Truell:23岁创立Cursor,与Github Copilot竞争
ai编程·cursor