没有发布会,GPT Image 1.5 凌晨发布,实测与Nano Banana2相比,各有优势,但也一言难尽...

OpenAI 急了。上周才刚推 GPT-5.2,这周又端上了新的图像模型。

就在今天凌晨2点多,OpenAI 发布了 GPT Image 1.5------也就是 GPT Image 1 的升级版。

按官方说法,新模型速度快了 4 倍、编辑更精确,而且 API 价格还下调了 20%。

看名字,更像是过渡模型,连发布会都没开,只是在x上发布公告,如果提升真的很大,那应该叫GPT Image 2。

话不多说,来看看有哪些改进,以及实测效果如何。

二、GPT Image 1.5 核心升级

2.1 速度提升:4 倍加速

指标 GPT Image 1 GPT Image 1.5
生成速度 ~60秒 ~15秒
提升幅度 - 4x

旧版模型动辄需要 1 分钟才能生成图片,新版的速度提升是实打实的改进。

2.2 精准编辑:核心卖点

这是 GPT Image 1.5 主打的能力------你让它改哪里,它就只改哪里

具体表现:

  • 光线一致性保持
  • 构图稳定不变形
  • 人脸特征多轮编辑后依然一致
  • Logo 和品牌元素精准保留

这解决了 AI 图像编辑长期以来的痛点:改一处、崩全图。

2.3 文字渲染能力增强

GPT Image 1 的文字能力只能说「勉强能用」,1.5 版本有明显进步:

  • 支持更小、更密集的文字
  • 适合生成信息图表、报纸版式等场景
  • 可渲染完整的 Markdown 表格和多段落文章

但需要注意:英文表现优秀,中文渲染仍有差距。

2.4 API 价格下调

图像输入和输出,都比之前降价了20%,也算是利好开发者的一个消息

GPT Image 1.5 与 Nano Banana2实测对比

看到新的生图模型,不免都会跟生图王者Nano Banana2进行一番对比,那实测效果如何呢?

示例1

Prompt: 一张复古宝丽来风格的照片,带有标志性的白边框,平铺在一个深棕色纹理表面上。照片内是伊隆·马斯克(Elon Musk)和山姆·奥特曼(Sam Altman)的合影。两人都戴着红白相间的圣诞帽。马斯克在左侧,穿着黑色皮夹克,面带微笑。奥特曼在右侧,穿着棕色纽扣衬衫,微笑着举起一瓶复古玻璃瓶装的可口可乐,瓶身上有经典的红色标签。背景是一个光线昏暗的酒吧,背景有模糊的酒架、灯串和暖色调的灯光。照片表面有颗粒感和轻微的划痕。

GPT Image 1.5:

Nano Banana Pro:

👉 人物生图这里,我更喜欢GPT Image 1.5的,完全根据我的Prompt来生成图片,氛围色彩都很到位,而Nano Banana上,仔细一看,你会发现照片表面并没有按照我说的一样,没有颗粒感和轻微的划痕。在指令遵循这方面,GPT Image 1.5略胜一筹。

示例2

Prompt:

做一个6列6行的网格图,内容如下:

第1行:希腊字母β、沙滩球、柠檬、机器人、鱼缸、青蛙

第2行:螳螂、名表、浴缸、墨镜、彩色蝴蝶、信封

第3行:邮票、相框、冒热气的饺子、单词miracle、双板滑雪板、字母Z

第4行:马桶、地铁代币、静音图标、香水、蜻蜓、滑板头盔

第5行:蓝牙图标、数字13、绿色的心、魔方、加拿大鹅、士兵头盔

第6行:白狗、救生衣、绳结、键盘、纸巾盒、数字14

GPT Image 1.5:

Nano Banana Pro:

👉 6x6网格图生成,从质感、写实等方面来看,gpt都不如banana的,甚至有一些还生成错了,比如第5行的加拿大鹅,gpt是直接给我生成了加拿大的国旗。在未输入明确提示词的前提下,banana会优先以写实为主。

示例3

Prompt:做一个1970年代伦敦切尔西的街景,要那种照片级的写实,全焦,纤毫毕现。街上人山人海,还要有一辆公交车,车上有个广告写着「ImageGen 1.5」,再加上OpenAI的标题和副标题「Create what you imagine」。整体风格要超写实的业余摄影,就像iPhone随手拍出来似的...

GPT Image 1.5:

Nano Banana Pro:

👉 GPT Image 1.5指令遵循很到位,很"随手拍",该有的都有,要素也都齐全,远处的英国国旗,行人不自觉地看向镜头,让人感觉就像是从人群中随手拍的一张照片,除了logo不太对以外没啥太多不适。

而反观banana这边,太全面了,各方面都想到了,连logo、公交侧面广告都想到了,不过整体照片就不像是业余摄影随手拍出来的,没有严格按照提示词来生成。

示例4

Prompt:做一张深海生物的海报,要展示不同深度的,图片为一个竖着的海洋剖面图,整体风格精细有趣,日系动漫风,中文解析

GPT Image 1.5:

Nano Banana Pro:

👉 深海生物海报,不管是从中文文字渲染上,还是从数据全面性来看,Banana完全碾压GPT Image 1.5,不过风格上还是gpt更符合日系动漫风一些。

实测总结

这次GPT Image 1.5在精准编辑和指令遵循上确实追上来了,但奈何有一个强大的对手:Nano Banana,所以很多方面都还有提高的空间。

作为中文用户,如果你是要生成包含中文、并且更有创意性的图片的话,首选Nona Banana,如果需要严格按照指令遵循的可以选择GPT Image 1.5。

整体来看,真要说GPT Image 1.5 和 Nano Banana Pro,到底谁更强?

毋庸置疑,目前仍然是:Nano Banana Pro,很多方面即使你不说,banana也会帮你想好,中文文字渲染、创意性、全能型拉满。

怎么使用到GPT Image 1.5呢

GPT Image 1.5已在ChatGPT中向Plus、Pro和Team用户开放,免费版也可使用,不过次数有限

打开 ChatGPT,现在侧边栏多了一个「Images」的入口。

点进去就是专门的画图空间,有预设滤镜和热门提示词,不用自己想提示词。

不需要切换,系统默认就是 GPT Image 1.5。

如果你还在为怎么如何快速升级苦恼的话,可以...

更多内容请前往原文查看

相关推荐
fanstuck18 小时前
从0到提交,如何用 ChatGPT 全流程参与建模比赛的
大数据·数学建模·语言模型·chatgpt·数据挖掘
acai_polo1 天前
如何在国内合规、稳定地使用GPT/Claude/Gemini API?中转服务全解析
人工智能·gpt·ai·语言模型·ai作画
有颜有货1 天前
GEO(生成引擎优化)是什么?GEO的工作流程详解
人工智能·chatgpt·geo
数研小生1 天前
用爬虫数据训练 ChatGPT 行业知识库:从数据采集到模型微调的实战指南
人工智能·爬虫·chatgpt
迈火2 天前
SD - Latent - Interposer:解锁Stable Diffusion潜在空间的创意工具
人工智能·gpt·计算机视觉·stable diffusion·aigc·语音识别·midjourney
空中楼阁,梦幻泡影2 天前
主流4 大模型(GPT、LLaMA、DeepSeek、QWE)的训练与推理算力估算实例详细数据
人工智能·gpt·llama
晓晓不觉早3 天前
OpenAI Codex App的推出:多代理工作流的新时代
人工智能·gpt
熙客3 天前
Claude 与 Claude Code 介绍、安装与使用
chatgpt
石去皿3 天前
Depth Viewer: 16-bit 深度图可视化工具
人工智能·chatgpt·prompt
kebijuelun3 天前
Towards Automated Kernel Generation in the Era of LLMs:LLM 时代的自动化 Kernel 生成全景图
人工智能·gpt·深度学习·语言模型