OpenAI发布首款自研芯片Jalapeño:9个月流片,AI设计芯片的时代来了

6月24日,OpenAI联合Broadcom(博通)和Celestica,正式发布了首款自研AI推理加速器------Jalapeño。

这不是一个实验项目。工程样片已经在实验室以目标频率和功耗跑着ML负载,包括GPT‑5.3‑Codex‑Spark。2026年底开始部署,而且是千兆瓦级数据中心、多代芯片平台的第一代。

从设计到流片,9个月。OpenAI说这是"高性能先进半导体领域有史以来最快的ASIC开发周期"。这个速度本身就是一个信号------AI设计芯片,不再是PPT上的概念了。

本文信息主要来源:OpenAI官网6月24日《OpenAI and Broadcom unveil LLM-optimized inference chip》、OpenAI 6月26日《Previewing GPT-5.6 Sol》、Cadence官网公开产品资料,以及IEEE/ACM等学术期刊中关于AI驱动EDA的相关研究。

一、Jalapeño是什么

Jalapeño的定位非常明确:LLM推理专用加速器。

不是从通用GPU改装过来的。不是把H100的架构修修改改。OpenAI原话是"blank-slate design"------白纸一张,从零开始,围绕LLM推理的需求从头设计。

几个关键要点:

全栈协同设计。 OpenAI不是只画了个芯片架构图然后丢给Broadcom制造。他们从芯片架构、kernels、内存系统、网络、调度、部署系统到产品体验,每一层都在自己手里。因为全栈都控,每一层都可以围绕同一个目标优化------让模型更快、更可靠、更便宜。这正是"全栈优势"的核心逻辑。

性能远超当前SOTA。 OpenAI说Jalapeño的每瓦性能"substantially better than current state-of-the-art"。具体数字还没公布(承诺未来几个月发布详细技术报告),但从架构描述来看------减少数据移动、平衡计算/内存/网络资源、让实际利用率接近理论峰值------这指向的是系统级效率的质变,而不仅仅是晶体管密度或时钟频率的线性提升。

通用性。 虽然是为OpenAI自家模型优化的,但Jalapeño的设计考虑了"当前和未来的所有LLM"。它不是只能跑GPT的特殊硬件。这一点很重要------如果Jalapeño生态能做起来,它可能成为整个LLM推理市场的基础设施,而不只是OpenAI的内部工具。

千兆瓦级部署。 Broadcom CEO Hock Tan说得很直白:2026年开始,与微软和其他合作伙伴一起部署千兆瓦级数据中心。这是一个产业规模的概念------不是几百台服务器,而是足以改变区域电力基础设施规模的算力集群。

二、9个月流片意味着什么

高性能芯片从设计到流片通常需要18-24个月,甚至更长。Jalapeño只用了9个月。

OpenAI把这种速度归因于三个因素:与Broadcom的深度软硬件协同开发、Broadcom的硅实现专长,以及------用OpenAI自己的模型加速了部分设计和优化流程。

这是一个闭环:"同样的模型在服务用户,也在帮助改进运行未来模型的基础设施。"

但更深层的含义是------这个9个月不是靠堆人堆出来的,而是靠方法论变革实现的。传统的芯片设计流程是串行的:架构设计→RTL编码→功能验证→物理设计→时序收敛→流片。每一步都可能因为发现问题而回退到前一步,迭代周期长。

AI辅助设计改变了这个范式。以Cadence的Cerebrus AI平台为例,它使用强化学习技术,可以同时探索数百种布局布线方案,在数小时内找到人类工程师可能需要数周才能优化的PPA(功耗、性能、面积)配置。Synopsys的DSO.ai也是类似的逻辑------用AI驱动的搜索替代人工试错。

当芯片设计的核心循环从"设计→仿真→人工分析→调整→再仿真"变成"设计→AI自动探索→AI自动优化→验证",整个迭代速度被压缩了不止一个数量级。

Jalapeño的9个月,就是这种范式的一个标志性案例。

三、AI设计芯片:从辅助工具到设计主体

Cadence和Synopsys这两家EDA巨头在过去几年里,完成了一次静默但深刻的转型。

Cadence在2021年推出了Cerebrus AI,最初聚焦于数字IC实现流程的自动化优化。到了2024-2025年,AI能力已经渗透到Cadence的全流程------从JedAI(大数据分析平台)到Verisium(AI驱动验证),再到Allegro X AI(PCB设计)。最新发布的Cadence Reality Digital Twin更是把AI拓展到了数据中心能效优化。

Synopsys的路径类似。DSO.ai在2020年首次商用后,迅速扩展为一个AI驱动的全流程套件------VSO.ai(验证)、TSO.ai(测试),覆盖了芯片设计从架构探索到硅后验证的完整闭环。

一个关键转折点是2024-2025年生成式AI进入EDA领域。传统的AI EDA工具更多是"优化器"------它们在给定约束下寻找最优解。但生成式AI让工具开始具备了"创造"能力:根据自然语言描述生成RTL代码、自动创建测试用例、甚至提出架构替代方案。

学术领域也在快速跟进。IEEE Transactions on CAD、DAC(设计自动化会议)和ICCAD等顶级期刊和会议上,AI驱动的EDA研究已经成为最大的热点。从Google在2021年发表的《A Graph Placement Methodology for Fast Chip Design》(用强化学习做芯片布局规划,登上Nature封面),到近年来涌现的大规模语言模型辅助RTL生成、基于图神经网络的时序预测,AI正在从芯片设计的"辅助轮"变成"发动机"。

Jalapeño的意义在于------它是这个趋势的集大成者和证明者。9个月完成高性能ASIC的设计和流片,这是以前不可想象的速度。如果AI能把芯片设计周期压缩50%以上,整个半导体行业的创新速度都将被重写。

四、为什么OpenAI要自己做芯片

这个问题的答案有三层。

第一层,成本。英伟达GPU的毛利率长期在65%-70%左右。对于OpenAI这种级别的算力消费者,自研芯片带来的单卡成本下降是巨大的。而且Jalapeño是为LLM推理专门优化的------不需要GPU上那些对LLM没用的图形处理单元,光是"去除冗余"就能带来可观的面积和功耗节省。

第二层,控制力。依赖第三方芯片意味着你的产品路线图受制于别人的芯片路线图。当OpenAI想要部署千兆瓦级的数据中心、想要把GPT-5.6 Sol的推理成本降到让每个学生都负担得起的时候,依赖英伟达的供货节奏和定价策略是一种战略脆弱性。自研芯片把这条命脉拿回到了自己手里。

第三层,也是最重要的:飞轮效应。OpenAI已经展示了一个完整的正反馈闭环------更好的模型设计更好的芯片,更好的芯片让训练和推理更高效,更高效的算力让更好的模型成为可能,更好的模型吸引更多用户和收入,更多收入投入到下一代基础设施。Jalapeño就是这个飞轮的关键齿轮。

五、对半导体行业的冲击

Jalapeño的发布对整个半导体产业链都有深远影响。

对英伟达而言,最大的客户变成了竞争对手。虽然短期内OpenAI仍然会大量采购GPU用于训练(Jalapeño目前只做推理),但推理市场是更大的那块蛋糕。如果Jalapeño的每瓦性能真的"远超当前SOTA",它可能从"开源节流"变成"替代方案"。

对Broadcom而言,这是一次战略转型的标志。Broadcom传统上不做标准化的AI加速器芯片,而是凭借其ASIC定制能力服务超大规模客户。Jalapeño证明了这个模式对AI时代同样适用------而且可能比"买现成芯片"更有竞争力。

对整个行业而言,Jalapeño验证了"AI设计芯片"的商业可行性。当9个月流片不再是个例而是新常态,芯片设计的门槛在降低、迭代速度在加快、创新周期在缩短。这对Fabless芯片设计公司(包括中国的半导体创业公司)既是机遇也是挑战------机遇在于可以用更少的工程师做更多的芯片,挑战在于如果跟不上这个速度就会被淘汰。

六、计算驱动的经济

OpenAI总裁Greg Brockman在发布会上说了一句值得深味的话:"世界正在走向一个计算驱动的经济(compute-powered economy)。"

这不是口号。当AI模型的能力以指数级增长、推理成本以指数级下降、芯片设计周期被压缩到9个月时,"计算"正在变成一种和水、电一样的基础设施。而控制基础设施的人,就控制着经济的命脉。

Jalapeño的多代路线图、千兆瓦级数据中心、博通的硅实现能力和Celestica的系统集成专长------这条产业链加上OpenAI的全栈控制力,正在构筑一个"AI基础设施帝国"。

英伟达的护城河依然很深------CUDA生态的锁定效应、训练侧的绝对优势、多年的架构迭代经验都不是短时间内能追上的。但Jalapeño的出现意味着:围墙已经开始出现裂缝。

更重要的是,如果AI真的能把芯片设计周期从18-24个月压缩到9个月甚至更短,那么未来芯片的迭代速度将不再是半导体行业的瓶颈。"用更快的AI设计更快的芯片,用更快的芯片跑更快的AI"------这个飞轮一旦转起来,算力成本的下降速度可能会超出所有人的预期。

而这,才是Jalapeño背后最值得关注的故事。


参考资料

1 OpenAI, "OpenAI and Broadcom unveil LLM-optimized inference chip," Jun. 24, 2026. Online. Available: https://openai.com/index/openai-broadcom-jalapeno-inference-chip/

2 OpenAI, "Previewing GPT-5.6 Sol: a next-generation model," Jun. 26, 2026. Online. Available: https://openai.com/index/previewing-gpt-5-6-sol/

3 Cadence Design Systems, "Cadence Cerebrus AI-Driven Chip Design," Online. Available: https://www.cadence.com/en_US/home/tools/digital-design-and-signoff/cerebrus.html

4 Cadence Design Systems, "Cadence JedAI Platform," Online. Available: https://www.cadence.com/en_US/home/tools/digital-design-and-signoff/jedai-platform.html

5 Synopsys, "Synopsys DSO.ai: AI-Driven Design Space Optimization," Online. Available: https://www.synopsys.com/implementation-and-signoff/ml-ai-solutions/dso-ai.html

6 A. Mirhoseini et al., "A Graph Placement Methodology for Fast Chip Design," Nature, vol. 594, pp. 207--212, Jun. 2021.

7 Broadcom Inc., "Broadcom Tomahawk Networking Silicon," Online. Available: https://www.broadcom.com/products/ethernet-connectivity/switching/strataxgs

相关推荐
武子康1 小时前
调查研究-213 UBTech U1:当人形机器人从“听懂指令“走向“情绪陪伴“
人工智能·机器人·agent
gooxi_hui1 小时前
海量存力,智驭未来丨国鑫4U60盘位高密度存储服务器SL401-G4重磅上市
运维·服务器·人工智能
太子釢1 小时前
Claude Code 工具调用机制详解
人工智能
ksueh1 小时前
AI写小说接入文心一言教程:千帆API+向量记忆系统实现百万字长篇智能创作
人工智能·ai助手
不焦躁的程序员2 小时前
程序员该补获客能力了
人工智能·程序员
AI科技星2 小时前
基于32维Cayley_Dickson超复数的全域拓扑统一场论——反重力、真空自持供能、维度瞬移与星际宇宙脑秩序体系
人工智能·学习·算法·机器学习·数据挖掘
星马梦缘2 小时前
机器学习与模式识别 第十四章 神经网络中的反向传播 模拟卷及答案
人工智能·神经网络·机器学习·微分·反向传播
吴bug2 小时前
认识 Open-ACE — AI 编程智能体的工作空间
人工智能·ai·ai编程
ksueh2 小时前
AI写小说工具哪个好用?9款AI工具使用体验(2026年横评)
人工智能·ai写作