AI 周刊【2026.04.20-04.26】:OpenAI 图像推理突破、模型开始偏科、国产模型5天5款

本周三件事值得聊。OpenAI 发布 GPT Image 2,推理模式让 AI 先"想"再画;GPT-5.5 智能体登顶但编程被 Claude 压制,模型开始"偏科";国产大模型 5 天密集发布 5 款旗舰。


一、GPT Image 2: AI 画图终于会"思考"了

OpenAI 发布 GPT Image 2,中文文字渲染准确率 99%+,推理模式让 AI 先"想"再画

4 月 21 日,OpenAI 正式发布 GPT Image 2,面向所有 ChatGPT 用户开放。最大突破:中文文字渲染从"一眼假"进化到"基本能用",准确率达 99% 以上;付费用户可启用 Thinking 推理模式,模型会先推理布局、调用网络搜索、分析素材再生成,一次可产出多张保持一致性的连续图像。全面超越此前标杆 Nano Banana Pro(Gemini 3 Pro Image)

个人点评:

我自己试了,提示词都简简单单,但效果震撼(可以参考我前面的文章)。嗯,很多设计师,可以下岗了。


二、GPT-5.5:智能体登顶,但编程不敌 Claude

OpenAI 发布 GPT-5.5,智能体能力全面领先,但 SWE-Bench 被 Claude Opus 4.7 压制 6 个百分点

4 月 23 日,OpenAI 发布 GPT-5.5,这是自 GPT-4.5 以来首个完全重训的基座模型。核心亮点:Terminal-Bench 2.0 复杂命令行任务准确率 82.7%,领先 Claude Opus 4.7 13 个百分点;GDPval 知识工作任务胜率 84.9%, OSWorld 计算机环境操作准确率 78.7%,智能体能力全面登顶。

但并非全面碾压。在最接近"修复真实 GitHub issue"的 SWE-Bench Pro 测试中,GPT-5.5 得分 58.6%,被 Claude Opus 4.7 的 64.3% 压制;多语言问答(MMMLU)仅 83.2%,远低于 Claude 的 91.5% 和 Gemini 的 92.6%。定价为 30 per M token,是 GPT-5.4 的两倍,但因 token 消耗减少 40%,实际成本接近。

个人点评:

Agent 自主执行有进步,啥时候 Code 能力,能真正追上 Claude 呢?


三、国产大模型集体爆发:5 天 5 款旗舰

月之暗面、阿里、小米、腾讯、DeepSeek 五天内密集发布,国产大模型进入"闪电战"节奏

本周国产大模型迎来史无前例的密集发布潮。4 月 20 日,月之暗面发布 Kimi K2.6,长程编码能力不间断 13 小时、编写 4000+ 行代码;同日阿里发布 Qwen3.6-Max-Preview,Code Arena 编程盲测全球第二。4 月 23 日,小米 MiMo-V2.5-Pro 发布,距上代仅 36 天;同日腾讯发布混元 Hy3 preview,前 OpenAI 核心研究员姚顺雨加盟后首作,三个月完成重建。4 月 24 日,DeepSeek-V4 压轴登场,百万字上下文、全面开源。

个人点评:

本周啥日子,这么热闹。AI 这是要开始加速度了?可以开始左脚踩右脚了?

相关推荐
无忧智库1 分钟前
某矿山井下人员精准定位与AI行为安全识别管控系统建设方案(WORD)
人工智能·安全
湘美书院--湘美谈教育6 分钟前
湘美谈教育AI经验集锦:有些东西,它们很难蒸馏
大数据·人工智能·深度学习·机器学习
HyperAI超神经9 分钟前
深度估计准确率冲上0.9,Meta提出VLM³,论证视觉模型天生会学3D,以Qwen3-VL-4B为基础实现多任务的统一建模
人工智能·3d·大模型·多模态·空间推理·3d感知·3d理解
Hello:CodeWorld10 分钟前
Dify 从入门到实战:部署、模型对接与企业级 AI 应用开发全教程
人工智能·python·架构·ai编程
AllData公司负责人16 分钟前
大模型赋能AllData数据中台,系列升级|通过联合智谱大模型与Chat2DB开源项目,建设Text2SQL生产场景全新体验的数据源平台!
数据库·人工智能·text2sql·数据中台·数据源·chat2db·智谱大模型
xinlianyq21 分钟前
2026 电商视觉红海突围:核心 AI 视频与海报创作工具实战选型指南
人工智能·aigc
Deepoch24 分钟前
Deepoc VLA开发板:除草机器人的持续学习与协同作业系统
人工智能·学习·机器人·开发板·具身模型·deepoc
生成论实验室29 分钟前
判断力与六十四卦:AI的第三块基石
人工智能·语言模型·机器人·自动驾驶·安全架构
xixixi7777732 分钟前
空天地通信、高速光模块、AI 智能体攻击、同态加密芯片四大事件解读:AI 算力底座攻防与全域通信同步升级
大数据·人工智能·深度学习·ai·大模型·光模块·智能体
水木流年追梦39 分钟前
大模型入门-大模型优化方法13- MTP 多 token 输出、DCA 双块注意力
人工智能·分布式·算法·正则表达式·prompt