AI科技周刊:2026年5月中旬大模型竞争白热化
随着2026年AI领域竞争进入新阶段,各大厂商密集发布重磅更新。OpenAI推出GPT-5.5后成为ChatGPT默认模型,DeepSeek v4、Claude 4.6、Gemini Pro等纷纷上线,超长上下文和智能体能力成为核心竞争方向。NVIDIA在CES 2026发布Rubin平台,推理成本降至Blackwell的十分之一。
本周要闻
1. ChatGPT默认模型升级至GPT-5.5 Instant
OpenAI于5月5日宣布ChatGPT默认模型替换为GPT-5.5 Instant。新模型聚焦准确性与简洁性,幻觉率最高减少52.5%。在医疗、法律、金融等高风险领域,不准确声明降低37.3%。所有用户已逐步获得更新,付费用户可在三个月内继续使用GPT-5.3 Instant版本。
来源:IT之家 https://news.qq.com/rain/a/20260506A01YQP00
2. 大模型厂商密集发布,竞争白热化
4月底至5月初,OpenAI发布GPT-5.5(Terminal-Bench 2.0达82.7%),DeepSeek v4推出Flash和Pro双版本(1M+ token上下文),Anthropic发布Claude Sonnet 4.6(接近Opus级别性能),Google更新Gemini Pro和Flash(1M token上下文)。IBM Granite 4.1以8B参数实现32B MoE模型性能,阿里巴巴推出Qwen3.6系列。多版本覆盖不同场景需求。
来源:掘金 https://juejin.cn/post/7637011261793501222
3. NVIDIA发布Rubin平台,推理成本骤降
NVIDIA在CES 2026发布Rubin平台,包含Vera CPU、Rubin GPU等六款芯片。通过极致软硬件协同设计,推理token成本降至Blackwell平台的十分之一,MoE模型训练GPU数量仅为四分之一。Spectrum-X以太网硅光交换机能效提升5倍。微软Azure AI超级工厂将部署数十万Rubin芯片。
来源:网易 https://c.m.163.com/news/a/KIK309NJ0552BFKV.html
4. 苹果将支持iOS 27中选择不同AI模型
苹果计划在iOS 27中允许用户为不同功能选择不同AI模型。此举将使iPhone用户能够根据场景需求灵活切换AI助手,告别统一的AI服务模式。这标志着苹果在AI领域采取更开放的合作策略,兼容第三方AI能力。
来源:JQman https://www.jqman.com/ainews/452511.html
5. 小米开源Xiaomi OneVL自动驾驶模型
小米宣布开源Xiaomi OneVL自动驾驶模型,业内率先实现VLA(视觉语言动作)、世界模型等多技术路线统一。这一开源举措将推动国内自动驾驶技术发展,为开发者提供更多研究素材。
来源:JQman https://www.jqman.com/ainews/452511.html
行业趋势
当前AI发展呈现三大趋势:超长上下文成为标配(1M+ token),小参数模型崛起(成本效率成焦点),智能体能力成为新战场。从问答助手向智能代理的转型正在加速,预计2026年40%企业应用将嵌入任务型AI智能体。