截至 2026-05-09 21:11(Asia/Shanghai),今天值得关注的 AI 前沿信息主要集中在四条主线:算力供给、训练基础设施、前沿模型监管评测,以及中美开源模型能力对比。
1. Anthropic 获得 SpaceX Colossus 1 算力,Claude Code 限额提升
Anthropic 在 5 月 6 日宣布与 SpaceX 达成算力合作,将使用 SpaceX Colossus 1 数据中心的全部计算能力。官方披露的数据是:新增超过 300MW 算力、超过 22 万张 NVIDIA GPU,并且这些容量会在一个月内上线。
直接变化包括:
- Claude Code 的 5 小时速率限制对 Pro、Max、Team、席位制 Enterprise 计划翻倍;
- Pro 和 Max 账户取消高峰时段的 Claude Code 限额削减;
- Claude Opus API 速率限制显著提高。
这件事的核心不是"某家公司又买 GPU",而是顶级模型公司正在把用户体验、代码 Agent 可用时长、API 供应能力,直接绑定到超大规模数据中心资源。Claude Code 这类长期任务型 Agent 的瓶颈,已经从单纯模型能力转向"推理容量能不能持续供给"。
2. OpenAI 开源 MRC:大模型训练开始进入"网络协议竞争"
OpenAI 在 5 月 5 日发布了 MRC(Multipath Reliable Connection)相关技术说明,并通过 Open Compute Project 公开规范。MRC 的目标是让超大规模 GPU 集群在链路故障、交换机重启、拥塞等情况下继续稳定训练。
几个关键信息:
- OpenAI 与 AMD、Broadcom、Intel、Microsoft、NVIDIA 合作开发 MRC;
- MRC 已部署在 OpenAI 最大规模的 NVIDIA GB200 超算集群中,包括 Oracle Cloud Infrastructure 在 Texas Abilene 的站点,以及 Microsoft Fairwater 超算;
- MRC 通过多平面网络、跨路径数据包喷洒、SRv6 源路由等方式,让训练网络能在微秒级绕开故障;
- OpenAI 称,MRC 支持超过 10 万张 GPU 的两层以太网交换结构,减少功耗、组件数量和动态路由复杂性。
这说明 AI 前沿竞争已经深入到基础设施底层:不是只有模型架构、数据和芯片重要,训练网络本身也会决定 GPU 的真实利用率。对行业来说,未来大模型训练的护城河会越来越像"芯片 + 网络 + 调度 + 数据中心工程"的组合系统。
3. 美国 CAISI 与 Google DeepMind、Microsoft、xAI 签署前沿模型预部署测试协议
美国 NIST 下属的 CAISI(Center for AI Standards and Innovation)在 5 月 5 日宣布,与 Google DeepMind、Microsoft、xAI 签署新的前沿 AI 国家安全测试协议。
协议要点:
- CAISI 可以在模型公开发布前进行政府评估;
- 评估范围包括前沿能力、安全风险和国家安全相关能力;
- 开发者可能向 CAISI 提供降低或移除安全防护的模型版本,以便进行更彻底测试;
- CAISI 表示目前已完成超过 40 次模型评估,其中包括尚未发布的先进模型。
这标志着前沿模型发布前评测正在制度化。对开发者而言,顶级模型的上市节奏、合规成本和安全审查都会更重;对企业用户而言,未来采购高能力模型时,"是否经过独立评测、评测覆盖哪些风险"会成为更重要的技术与治理指标。
4. CAISI 评估 DeepSeek V4 Pro:能力落后前沿约 8 个月,但成本效率突出
CAISI 在 5 月 1 日发布 DeepSeek V4 Pro 评估。结论比较清晰:DeepSeek V4 Pro 是 CAISI 评估过的最强中国模型之一,但整体能力大约落后美国前沿模型 8 个月。
关键发现:
- 评估覆盖网络安全、软件工程、自然科学、抽象推理、数学等领域;
- CAISI 称 DeepSeek V4 Pro 在非公开评测中的表现更接近 8 个月前发布的 GPT-5,而不是 DeepSeek 自报数据中接近 Opus 4.6 和 GPT-5.4 的水平;
- 但 DeepSeek V4 Pro 的成本效率明显强,在 7 个基准中的 5 个上比美国同等能力模型更具成本优势;
- 在数学类任务上,DeepSeek V4 Pro 表现非常接近顶级模型,但在网络安全、抽象推理和部分软件工程任务上差距更明显。
这对行业的启示是:开源/开放权重模型继续压低推理成本,但真正的前沿能力仍然依赖更强的训练基础设施、闭源评测体系和复杂 Agent 场景验证。企业选型时不能只看公开榜单,要同时看真实业务任务、成本曲线和安全边界。
结论:AI 竞争正在从"模型发布竞赛"变成"基础设施与治理体系竞赛"
今天这几条新闻指向同一个趋势:
- Anthropic 的 SpaceX 算力合作说明推理容量已经成为产品体验的硬约束;
- OpenAI 的 MRC 说明训练效率取决于数据中心网络与故障恢复能力;
- CAISI 的前沿模型协议说明顶级模型发布会越来越接近"准监管流程";
- DeepSeek V4 Pro 的评估说明低成本模型仍有强冲击力,但前沿能力差距不能只靠价格弥补。
一句话总结:2026 年的 AI 前沿竞争,不再只是"谁的模型参数更强",而是谁能持续获得算力、把 GPU 利用率做高、稳定支撑 Agent 长任务,并在监管与安全评估体系中保持发布速度。
参考来源
- Anthropic:Higher usage limits for Claude and a compute deal with SpaceX
https://www.anthropic.com/news/higher-limits-spacex - OpenAI:Supercomputer networking to accelerate large scale AI training
https://openai.com/index/mrc-supercomputer-networking/ - NIST:CAISI Signs Agreements Regarding Frontier AI National Security Testing With Google DeepMind, Microsoft and xAI
https://www.nist.gov/news-events/news/2026/05/caisi-signs-agreements-regarding-frontier-ai-national-security-testing - NIST:CAISI Evaluation of DeepSeek V4 Pro
https://www.nist.gov/news-events/news/2026/05/caisi-evaluation-deepseek-v4-pro