地平线10年征途:第四代BPU登场,打造物理世界AI底座

作者 | 肖恩

编辑 | 德新

深圳的冬天,总是让人误以为季节失准。十二月的空气带着春天般的温热,就在这样不似冬日的暖意中,一场同样"热闹"的大会也在这里举行------地平线的第一届技术生态大会。

参加这次会议的,是中国乃至全球智能汽车产业链最有权利的技术决策者们:头部主机厂的技术负责人、整车企业的智能化掌舵者、Tier 1的产品与研发决策者,以及一线的具身智能创业者。与其说是一场发布会,不如说这是地平线与它的朋友们共同召开的行业聚会

大会主题是"向高同行"。"向高",是地平线十年里不断突破技术边界的精神象征;"同行",则是地平线对"生态"二字最朴素也最深刻的理解------真正的技术跃迁从来不是独行者的胜利,而是由一整个生态的共同进化催生而成。

几个月前,在地平线的夏季技术发布会上,余凯第一次提出"向高而行",用来概括地平线过去十年的技术路径,从"向高而行"到"向高同行",虽然只是一字之差,却是地平线进一步清晰表达了自己的长期商业战略:从独自攀登技术的高峰,到与生态伙伴一起走向更广阔的未来。

这家刚刚走过十年,穿越了数轮行业起落的公司,如今正为了新的目标再次启程:携手最广泛的合作伙伴,让曾属于少数人的顶尖技术,真正服务于最广泛的企业与用户,实现智能时代的普惠。

在大会上,地平线也释放了众多重磅信息,包括:

  • 下一代BPU架构黎曼,地平线10年时间用4代BPU实现了1000倍算力提升;

  • 酷睿程也将基于这一代BPU自主设计一款全新芯片C7H,瞄准500 - 700Tops算力;

  • 地平线启动全新的HSD Together开放模式,包括BPU、算法与模型,以及工具链;

  • HSD量产两周后,激活数量已经超过12000辆;

  • 基于单J6M的城市NOA即将量产,将把智驾打到10万以内车型;

  • 面向机器人时代,地平线开源两款基座模型HoloMotion和HoloBrain,帮助具身开发者打造「大小脑」。

一、BPU、编译器和算法:通往物理世界AI的三大支柱

如果把时间拨回到2016年,当时传统意义的摩尔定律已经开始显露疲态,晶体管堆叠不再带来线性增长的性能红利,行业都在讨论"摩尔定律是否失效"。刚刚创立的地平线提出了"新摩尔定律"------计算的发展将由面向智能任务的专用计算架构、算法与系统的协同优化所驱动,而不是单纯依赖通用处理器工艺的线性演进。

十年后的今天,行业正在向打造物理世界AI迈进,余凯将AI计算比喻为一场硅基世界宏大的交响乐:"BPU计算是一流的交响乐团,编译器是杰出的指挥,而算法则是优秀的作曲------三者协同,追求极致的性能功耗比与性能成本比,打造出算法效率、硬件效率和灵活性的最优解。"

BPU:从伯努利到黎曼,流形理论重塑征程7

从征程2上的伯努利到征程6上的纳什,地平线每一代的BPU架构都以数学家的名字命名。

这次,余凯也第一次系统解释了每代命名背后的数学来源以及对应的架构思想。地平线过去十年的芯片路线,其实是一部"把数学写进架构"的技术史

  • 伯努利架构:以概率让世界显形。早期ADAS的核心任务只有一个------"看见"。"看见"并不是人类直觉里的"有"或"没有",而是对每一个像素、每一块区域给出一个0到1之间的数字,表示"它属于车辆、行人或标线的概率有多大"。所有感知网络本质上都是在做这种概率估计。但是在当时有限的制程下,芯片无法承载大量的浮点运算,地平线率先使用更节省资源的定点计算来承载概率计算。伯努利作为概率分布的提出者,被视作这类任务最贴切的数学象征。基于此思路地平线打造了征程2、征程3,它们所服务的高速 ADAS,本质上就是"把世界拆解成概率问题"。

  • 贝叶斯架构:世界不是静止的,未来需要被预测。当高速NOA进入主流,问题不仅是"看到了什么",而是"接下来会发生什么"。汽车、行人、自行车的运动轨迹,都带着复杂的时间依赖关系;一个模型必须能从当前时刻推断未来数秒的动态演化。贝叶斯推断正是处理这种"带不确定性的时序预测"的核心数学框架。余凯本人在学术阶段的大量研究也基于此,因此新架构被命名为"贝叶斯",征程5就是基于此为高速NOA设计的芯片。

  • 纳什架构:城市交通是一个高维博弈系统。当自动驾驶走向城区,问题又发生了变化。城市里车辆与行人之间的互动不是简单的物理模型,而是充满策略性的"博弈":谁先走、谁让谁、预判对方的动作,往往不是规则决定,而是行为之间的相互影响决定。"纳什均衡"的理论恰好刻画了这种"多个主体基于对他人的预测做出决策"的系统,这一代的架构被命名为纳什,采用这一架构的征程6家族芯片,能够对复杂博弈场景进行实时响应,也这让征程6成为最成功的一代芯片,量产交付的第一年就实现了超百万级的出货。

面向未来,自动驾驶的目标不是达到人类的驾驶水平,而是要远远超越人类,这需要系统理解物理世界背后的规律。自动驾驶所面对的空间------道路形态、车辆状态、行人行为------看起来都是杂乱无章的高维数据,但真实世界并不会在这个高维空间中任意飘散,而会被约束在某种更低维、更连续的结构上。

这种结构,正是数学家黎曼150多年前提出的"流形":它描述的是一种"整体可以无限弯曲,但局部永远像一块平面那样可被准确刻画"的空间。现代AI正是沿着这一思想演化而来:图像、语音、动作、交通参与者的行为轨迹,看似变化无穷,维度极高,但模型并不是在真正意义上处理"无限维度",而是在学习一个潜在的、更低维度、连续且可预测的"世界流形"。

换句话说,深度学习的许多成功并非偶然,而是因为它隐含假设了:世界是有结构的,而不是无限混乱的

地平线将第四代BPU架构命名为黎曼,是致敬以"黎曼流形"理论揭示复杂空间本质的数学巨匠。

在传统CNN或Transformer芯片中,张量(Tensor)计算是主角------它擅长处理大规模矩阵、卷积、注意力等"密集结构",但流形的本质并不是大矩阵,而是向量。

轨迹、姿态、速度、加速度这些物理量本质上是向量场。张量计算负责把世界作为一个整体看清楚,而向量计算是让模型真正理解"世界在局部是如何变化的"。

黎曼架构的底层思想可以概括为一句话:让向量计算与张量计算各司其职、协同表达世界流形的结构

这一代架构将向量计算作为核心算子,让BPU在处理物理世界问题时具备"几何直觉"。

此外,黎曼架构实现了关键算子算力10倍提升、高精度算子支持数量超过10倍增加,支持全浮点计算,并在大语言模型场景中实现能效5倍提升。征程7系列芯片将全系搭载黎曼架构。

从伯努利到黎曼,地平线的BPU在十年间实现了超过1000倍的性能提升,其进化速度远超传统摩尔定律。

编译器:从手写规则迈向AI驱动

在自动驾驶行业里,大家习惯讨论的是算力和模型大小,却往往忽略了一个极其关键的技术层:编译器。它决定一颗芯片的真实性能能否被完全激活,也决定一套自动驾驶模型能否在受限的功耗、面积、带宽中稳定运行。

如果把BPU比作一支能力极强但组织复杂的乐团,那么编译器就是决定演奏品质的指挥家:决定哪个单元在什么时候执行、如何调度数据、如何融合算子、如何复用存储,使整颗芯片的有限资源发挥最大效率。

没有强大的编译器,再强的芯片也无法稳定发挥其最大性能

英伟达在GPU时代构建起了CUDA、cuDNN、TensorRT这一整套工具链,目标是为尽可能多样的模型和任务提供统一的编程和优化环境。它追求的是强通用性,既要服务云端训练,也要兼顾边缘推理,既要支持各类视觉、语音、推荐模型,又要适配不同形态的硬件加速卡。在这样的目标之下,英伟达可以允许几十瓦乃至上百瓦的功耗,以大张量计算为中心,优先追求整体吞吐和通用适配的效率。

但这种极致通用性带来的代价也很明显。面对特定的模型结构和特定的场景约束,要做到极致优化会变得困难;在严苛功耗预算之下,要持续保持很高的硬件利用率也并不容易;而面向复杂系统时,要完全可控地管理端到端时延,往往需要在编译链之外再做大量工程工作。

地平线的选择几乎是反向的。它的编译器天工开物OpenExplorer,从一开始就不是为了服务"所有模型",而是围绕BPU这一专用架构深度定制,以车规低功耗、高实时性为第一约束条件,以自动驾驶算法为主要优化对象。它更关心的是,在几十瓦甚至个位数的能耗之内,怎样榨干芯片的每一份算力。

早期编译优化主要依赖工程师手写启发式规则,但在高度并行、结构复杂的BPU上,这种方式迅速暴露出搜索空间巨大、难以迁移、架构一代更新就要重写的局限。

此次地平线发布的第四代编译器天工开物4.0,核心变化之一就是引入强化学习和蒙特卡洛树搜索,把编译过程本身视为一个连续决策过程。

编译器会在庞大的可能空间中搜索那些人类肉眼难以枚举的组合,把最优或近似最优的执行路径自动找出来。这样一来,编译时间从过去的小时级被压缩到分钟级,平均性能获得20%以上的提升。

HSD:物理AI基座模型的开端

除了乐队和指挥,AI世界还需要一个通用的曲谱。过去很长一段时间,AI 基本是一个任务一个模型,语音、推荐、视觉各自为战。近几年大语言模型的出现,第一次在数字世界里把多种任务统一到同一套大模型上,成了通用的基座模型。但在物理世界,还没有这样的基座模型。

余凯认为,自动驾驶作为物理世界应用最广泛、复杂度最高的场景,是通往物理世界 AI 基座模型的关键路径。

如果做不好自动驾驶,恐怕就无法在机器人时代占据一席之地。

HSD就是地平线的自动驾驶基座大模型,它是如何诞生的?

地平线首席架构师苏菁在这次会上也分享了HSD开发的故事。他提到了一个关键的事件,那就是特斯拉FSD V12的发布,虽然对FSD的能力很多人持有不同的意见,但是对于自动驾驶行业来说这是一次重要的分水岭。

在此之前深度学习技术的发展都集中在感知部分,而规控几乎还是规则为主,这导致整个系统的表现始终无法达到人类的驾驶水平,即使行业能感觉到正确的方向在哪里,但是理论上可行和现实中落地之间有着巨大的鸿沟。FSD V12的出现就是告诉所有人,一段式端到端的方向不仅正确而且是可行的

这是一次范式的变革,HSD在此基础上进一步走向工程化。与过去的自动驾驶软件栈不同,HSD不再以功能模块来划分能力,没有单独的行车、泊车模块,而是让一个统一的模型直接学习从感知到控制的连续映射,把世界建模、行为理解、意图预测和轨迹生成全部纳入同一个结构中,实现了"Video in,Control out"。

如果你体验过HSD,会明显感受到其驾驶行为高度拟人。原因在于,它从海量驾驶数据中学习交通参与者之间的隐性协同行为、城市环境中人与车之间的互动方式,以及驾驶节奏、礼让与意图表达。它不再为"变道""绕行障碍物"等行为单独设定规则,而是让它们作为交通规律的自然体现自动涌现。

余凯还回答了关于HSD的另一个问题:为什么地平线要做HSD?

原因在于,随着辅助驾驶从高速NOA走向城市NOA,模型训练成本急剧上升,训练完整系统的成本可能高达数十亿元,最终效果却未必理想,且需要大量顶尖AI人才。为了让更多客户能够承担起技术成本,地平线打造了HSD,作为技术样板间,让客户在地平线技术底座上快速构建系统,从而节省大量时间、算力与人力。

通过在BPU、编译器和算法上的突破,地平线完成了"向高"的目标。下一步,则是与更多生态伙伴一起"同行"。

二、HSD Together,把城区智驾打到10万级

如果说技术决定了地平线的天花板,那么生态则决定了它能走多远。

地平线成立之初,智能驾驶市场远没有今日这般热闹,车企普遍认为ADAS是供应商交付的成品功能,而非值得投入的核心差异点。当时的ADAS市场被国际供应商垄断,而黑盒交付的模式也让车企既依赖又无奈。

"HSD Together",智驾开放的新篇章

在这样的背景下,一家中国初创公司切入车规级智能驾驶芯片,被认为是几乎"不可能完成的任务"。但地平线没有选择选择黑盒交付的模式,而是反其道而行:从第一天起,就以"开放平台"进入市场。对地平线来说,"开放"不是口号,而是在当时的市场中,几乎唯一现实的选择。

于是,地平线做了一个在当时看来极具风险的决定:不仅提供SoC,还开放推理引擎、开放算法IP、开放工具链,甚至把模型训练方法、标定体系也一起交给生态伙伴,让他们能够按照自己的需求去开发、调整智能驾驶能力。

开放模式让地平线迎来了第一批合作伙伴和车企客户,长安、上汽、奇瑞和理想等搭载征程2芯片的车型陆续上市,征程3之后开始大规模量产,征程5则撬开了中高端市场;征程6真正遍地开花,迎来国内多家主机厂定点,地平线的朋友圈开始真正扩展------从最早愿意尝试的平台型车企,到如今几乎所有头部OEM、国际Tier 1都进入了地平线的生态圈。

进入征程6时期,地平线在开放的模式上再进一步,推出了**"HSD Together"模式**,它不是简单地把HSD当作黑盒方案卖给所有人,而是将其拆解为可组合的多层结构:

  • 底层是BPU架构,可通过IP授权方式让客户基于地平线架构设计自己的高算力芯片;

  • 中间层是HSD的算法和模型,可通过算法服务或模型IP授权的方式交付,与OEM和Tier1基于各自数据共同训练;

  • 上层是工具链、推理引擎和标定体系,支持合作伙伴在统一工程栈上进行二次开发。

酷睿程将基于地平线第四代BPU自主设计一款智能驾驶芯片C7H,采用3 - 4nm制程,AI算力达到500 - 700 TOPS,将和大众中国下一代CEA电子电气架构深度适配,作为该架构下的核心智驾算力平台。

地平线不再只是芯片供应商,而是将BPU架构授权给伙伴,让他们在坚持自研节奏与规划的基础上,直接继承地平线在车规智能计算上的全部积累。

奇瑞星途ET5和深蓝L06首发HSD上车,则体现了HSD Together在"算法/产品侧"的另一种落地路径。

地平线提供的是已经跑通的大模型和工具链,车企把精力集中在功能定义、体验打磨、车型集成上。结果就是,以远低于行业平均成本、也远短于传统工程周期的方式,让城市NOA出现在主流价格带的车型上。

HSD量产后的两周内,激活数量已经超过了12000辆,更加印证了这个模式的成功。

单J6M城市NOA,把城区智驾打到10万以内

年初行业内的口号是"智驾平权",希望让更多的消费者能体验到高速NOA功能带来的安全与便利,现在HSD的量产则把城区辅助驾驶下探到15万元的车型,那么下一步是什么?

今年前三个季度,乘用车的销量按照价格区间划分,20万以上车型占30%,13万 - 20万占20%,而13万以下的车型占50%。

过去的城区辅助驾驶方案需要大算力芯片、昂贵的传感器以及巨额的研发投入,因此只有20万以上的车型才能享受到这样的功能,HSD已经把好用的城市NOA功能带到了13万(深蓝L06)和15万(星途ET5)的车型上,但是那些10万区间的车主,就不配拥有这样的功能吗?

"智能驾驶普及的真正拐点,从来不是技术突破本身,而是用户规模突破。"余凯这样宣告了单J6M的城区辅助驾驶方案,采用风冷的域控设计,可以完美适配燃油车,包括10万区间的主流车型。

在他看来,城区辅助驾驶不应该是高高在上的功能,而是应该成为每一辆汽车的标配,它应该是汽车行业新时代的"自动挡"。

首批基于单征程6M的合作伙伴,有两种不同的合作模式:

第一种是经典的基于芯片、工具链参考设计所提供的这种合作模式,博世、卓驭和轻舟正在基于这种模式开发J6M的产品。

第二种是HSD Together模式,地平线与电装、大众的合资公司酷睿程、HCT将采用这种模式,推出好用的城区辅助驾驶。

三、向机器人迈进,成为物理世界的AI基座

除了智能汽车,地平线也已经成为中国最大的「消费类机器人计算方案供应商」。

地平线和子公司地瓜机器人已经与合作伙伴推出了超过100款的消费类智能产品,连接上下游超100家合作伙伴,以及10万余名开发者。

从云鲸扫地机器人,到维他动力能提供情绪价值的无遥控自主移动机器狗,再到革新影像创作的影石Insta360全景无人机,都采用了地瓜的计算方案。

下一阶段AI将迈向具身智能时代,要让机器人真正走向现实世界,不仅要像人一样思考,还需要和人一样行动。地平线也正式发布面向机器人的开源基座模型HoloMotoion和HoloBrain。

HoloMotion:让机器"动得像人"

HoloMotion是一套面向人形与具身机器人的"全身控制基础模型",目标是在真实世界中实现鲁棒、实时、可泛化的整机运动控制。它并不是一个孤立的策略网络,而是一整套端到端的工程体系:从动作数据的采集与清洗,到人类动作向不同机器人形体上的重定向,再到分布式大规模训练、评测验证,直至通过ROS2等中间件无缝部署到真实硬件上,完整覆盖了"数据--模型--部署"的全链路。

与传统"控制某几个关节"的思路不同,HoloMotion关心的是整个人形在各种任务与地形下能否保持自然、连贯、稳定的动作风格。

它通过模仿学习与强化学习相结合,从海量人类运动中学习"身体的语言",再在此基础上向不同形态的具身平台迁移,让机器人先获得"身体的智慧",再谈更高层的任务与语义。

这并不是一条与自动驾驶平行的新技术线,而是自动驾驶里那块"轨迹、控制与动力学能力"的自然外延:从让车在物理世界里动得正确,走向让任意具身载体在物理世界里动得优雅、安全

HoloBrain:让机器"像人一样思考"

如果说HoloMotion是机器人的"小脑",负责让身体在真实世界里运动得自然、稳定,那么HoloBrain就是它的"大脑",指向的是操作智能和世界模型能力。

HoloBrain采用VLA架构,重点解决的是机器人如何在复杂环境中理解人类指令、读懂场景结构,并规划出一系列细腻、可靠的操作行为。

与传统的"感知 + 规则 + 控制"三段式系统不同,HoloBrain直接在统一模型内部完成从多模态理解到动作决策的闭环,使机器人能够以近乎人类的方式去完成任务。

从工程形态看,HoloBrain本质上是一种轻量、可实时推理的操作世界模型:一端接收来自摄像头、力矩传感器等的连续观测,以及自然语言或结构化任务指令,另一端输出可执行的操作轨迹、抓取姿态和动作序列。

模型在训练阶段通过大量人类演示和真实交互数据,学习物体之间的关系、动作对环境的影响,以及任务执行过程中的时序与因果结构;在推理阶段,则以较小算力开销完成"看懂场景--拆解任务--生成动作"的完整链条。它关心的,不再只是"手应当移动到哪里",而是"在什么顺序、以怎样的力度和轨迹,与哪些物体发生怎样的接触",这正是操作智能中最难被手工规则穷尽的部分。

与智驾大模型相比,HoloBrain面对的是更高维度、更细粒度的接触与操作空间:从开门、抽屉、按钮,到抽取物体、摆放物品、协作搬运,每一个任务都隐含着丰富的物理约束与人机协同模式。

因此,它可以被视为"面向具身机器人、以操作为中心的世界模型雏形":智驾中的HSD负责在大尺度空间里理解道路与交通参与者,而HoloBrain则在局部空间里建模物体、工具与双手之间的交互。两者共享同一种"物理世界观",前者处理"如何在世界中移动",后者处理"如何与世界发生作用",共同构成面向机器人时代的通用物理智能基座。

四、千万出货之后,地平线的未来图景

对地平线来说,技术的演进从来不是一家公司单向推动的,而是在与产业伙伴的长期协同中被不断验证、放大和普及。

过去几年,从征程2到征程6,从芯片、编译器到大模型,技术在向上生长的同时,也在被越来越多主机厂、Tier 1和开发者吸收、改造,最终变成用户日常可感知的产品体验。

余凯在演讲中提到,"让少数人的尖端,成为多数人的日常"。

真正重要的技术革命,不以某个领先指标为终点,而要在大规模普及中完成意义的闭环------当城区辅助驾驶能进入十万元级车型,当具身智能能力通过开源与生态扩散被更多场景复用,技术的价值才真正落在社会层面。

截至目前,从征程2到征程6,地平线征程家族芯片累计出货已超过1000万套,这是行业对这一路线的阶段性投票。面向未来三到五年,地平线希望与更多生态伙伴一道,把同样的规模效应复制到软件和大模型层面,共同奔赴"城区辅助驾驶方案HSD千万量产"的下一个里程碑。

技术继续向高,生态持续同行,让智能能力在成本可承受、体验可感知的前提下,真正走进更多普通用户的日常生活。

相关推荐
万俟淋曦1 个月前
NVIDIA DriveOS 推动新一代智能汽车实现突破
人工智能·ai·汽车·nvidia·智能汽车·driveos·driveworks
玩硬件的小码农1 年前
本科阶段最后一次竞赛Vlog——2024年智能车大赛智慧医疗组准备全过程——11上位机与小车交互
地平线·智慧医疗组·智能车大赛
瑶光守护者1 年前
【学习笔记】技术分析-华为智驾控制器MDC Pro 610分析
笔记·学习·华为·智能驾驶·智能汽车
玩硬件的小码农1 年前
本科阶段最后一次竞赛Vlog——2024年智能车大赛智慧医疗组准备全过程——3bin模型转化环境的准备
机器人·ros2·地平线·智慧医疗组·智能车大赛
我想学LINUX1 年前
【面经】C++八股文(地平线C++一面)
开发语言·c++·算法·校招·八股文·面经·地平线
陈哥聊测试2 年前
你的智能汽车正在窥视你!
软件测试·数据安全·安全测试·特斯拉·数据泄露·数据隐私·智能汽车·数据窃取·私有部署
RF_star2 年前
信驰达蓝牙数字钥匙方案持续创新,助推智慧汽车生态发展
智能汽车·蓝牙数字钥匙·蓝牙技术·信道探测·无线通信技术
Mr.Cssust2 年前
【研发日记】CANoe自动化测试的配置方式(三)——SystemVariables数组方式
自动化测试·测试开发·capl·canoe·嵌入式软件·智能汽车·systemvariables
经纬恒润2 年前
DYC算法开发与测试(基于ModelBase实现)
汽车动力学仿真·直接横摆力矩控制·辅助驾驶