【自动驾驶技术】自动驾驶汽车AI芯片汇总——地平线篇

0. 前言

按照国际惯例,首先声明:本文只是我自己学习的理解,虽然参考了他人的宝贵见解及成果,但是内容可能存在不准确的地方。如果发现文中错误,希望批评指正,共同进步。

本篇文章是这个系列的第二篇,介绍地平线公司的车载SoC芯片,主要是**征程®(Journey™)**系列产品。

自动驾驶汽车AI芯片系列目录:

1. NVIDIA篇

地平线机器人科技有限公司(Horizon Robotics)是一家中国的人工智能计算平台公司,专注于边缘人工智能芯片的研发,以及基于此的解决方案。征程系列芯片是由地平线自主研发的,主要面向汽车智能驾驶领域,包括辅助驾驶、自动驾驶等应用场景。

这些芯片设计用于处理复杂的人工智能任务,具备高性能、低功耗的特点,代表了中国在车规级AI芯片领域的自主研发成果。尤其是在ZM关系日益复杂的今天,**"自主研发"**显得尤为重要!

在本篇正式开始前,首先我要吐槽下地平线没有类似NVIDIA的developer zone,也找不到一些公开的技术手册。本文的信息大部分基于公开演讲提取、整理出来,部分插图质量会非常差,请谅解。

1. BPU

在开始介绍整体SoC产品之前我想先聊聊地平线的独门秘技------BPU(Brain Processing Unit):

1.1 BPU介绍

BPU是由地平线提出的一种专门为人工智能应用设计的处理器架构,特别聚焦于深度神经网络的高效计算。它是地平线在嵌入式人工智能领域的重要技术创新,旨在解决传统处理器在处理大规模并行计算任务时的效率问题,特别是在图像识别、语音处理、自然语言理解和控制等领域。

1.2 BPU架构理念

高度优化的AI计算引擎 :BPU设计的核心是为深度学习算法量身定制,通过优化的硬件加速器实现卷积神经网络(CNN)、循环神经网络(RNN)、Transformer等复杂神经网络模型的快速计算。这使得在有限的功耗和成本下,能够达到更高的计算效率和性能。

软硬件协同优化 :地平线在开发BPU时强调软硬件的深度整合,确保算法、编译器和硬件架构三者之间的紧密配合。通过这种协同,BPU能够更好地适应不断发展的深度学习算法,实现算法效率和硬件效率的双重提升。

1.3 BPU迭代发展

高斯架构: 第一代BPU架构,标志着地平线在嵌入式人工智能领域的重大突破。这一架构专注于提升深度学习算法在边缘设备上的运行效率(地平线一直很注重芯片能效比),以及视觉处理性能。

伯努利架构:第二代BPU架构,应用于征程2和征程3等芯片中,以其性价比、灵活性和可靠性获得了广泛应用。

贝叶斯架构:第三代BPU架构,用于征程5芯片,这是全球少数实现量产的大算力智能驾驶芯片之一,专为高等级智能驾驶设计,展现了强大的数据处理和实时决策能力。

纳什架构:第四代BPU架构,进一步优化了深度学习加速计算,尤其擅长处理大规模参数的Transformer模型,强化了对自动驾驶场景的支持,提升了能效比和计算密度,征程6即采用了这一架构。

2. 地平线征程系列产品

2.1 征程2系列

征程2系列是地平线推出的首款车规级AI芯片,搭载伯努利1.0 BPU,标志着中国在车载AI芯片领域的突破。适用于高级辅助驾驶(ADAS)、智能座舱等场景,支持基于深度学习的图像处理、识别等功能。

2.2 征程3系列

基于自研的BPU伯努利2.0架构,专为高级辅助驾驶设计,高效能且应用广泛。支持深度学习的图像检测、分类、像素级分割,以及视频编码,实现自动泊车辅助等功能。理想ONE 2021款搭载征程3芯片,实现了导航辅助驾驶功能。

2.3 征程5系列

提供强大的计算能力,足以满足未来几年内智能汽车行业的发展需求。支持更复杂的自动驾驶功能,如NOA(Navigate on Autopilot)功能,已在理想汽车的L系列车型中应用。除了理想汽车,还有其他多家汽车厂商合作,展示了其在高级别自动驾驶领域的实力。

2.4 征程6系列

于2024年4月刚刚正式发布,预计同年第四季度完成首批量产车型交付。旗舰产品算力高达560 TOPS,是业界首款覆盖从低到高全阶智能驾驶需求的车载智能计算方案。采用第四代BPU架构"纳什",专为大规模参数的Transformer模型和高级智能驾驶优化。与比亚迪、理想汽车等十家主流车企达成合作,加速智能驾驶平权,引领未来出行。本文也将重点针对征程6系列产品进行说明。

2.5 综合特点

统一架构:征程系列采用统一的硬件架构、工具链和软件栈,便于开发和维护,支持跨代兼容。

高效能低功耗:设计注重能效比,适合车载环境的严苛要求。

广泛生态:构建了开放的生态系统,促进软硬件生态伙伴的合作,加速智能驾驶的商业化落地。

3. 征程6介绍

与以往征程系列前几代产品不同的是,征程6(我们业内称为J6,"钩6")并不是一款芯片,而是根据算力大小,分成了J6B/J6L/J6E/J6M/J6H/J6P 6款!

3.1 J6P芯片参数

**CPU:**18核心的ARM Cortex-A78AE,算力是410K DMIPS

**BPU:**如上文介绍,采用了纳什架构第四代BPU,560TOPS算力(注意上图左下角的一行小字:560TOPS算力是等效1/2稀疏网络下的算力,必须严谨!)

算法支持:对Transformer算法的支持效率在业内领先,同时支持大规模交互式博弈等前沿算法,表明其在处理复杂AI任务上的优越性能。

功能安全: 通过ISO 26262 ASIL-D功能安全流程认证 ,主动安全AEB ASIL-B产品级功能安全认证

关于J6的GPU和MCU目前没有获取相关参数,公开后我会再补充。

3.2 四芯合一的芯片架构

J6芯片所实现的"四芯合一"是指将以下四种关键处理单元集成在同一颗系统级芯片SoC上:

1. CPU(Central Processing Unit):负责通用计算任务,处理非特定的计算工作负载,是芯片的控制中心,执行操作系统的指令和应用程序的逻辑控制。

2. BPU(Brain Processing Unit):地平线自主研发的神经网络处理单元,专门针对人工智能算法和深度学习任务进行了优化,如图像识别、自然语言处理等,是实现智能驾驶核心算法的关键。

3. GPU(Graphics Processing Unit):图形处理器,除了传统意义上的图形渲染,现代GPU也广泛用于并行计算,特别是在机器视觉、环境感知等需要大量并行处理的场景中。

4. MCU(Microcontroller Unit):微控制器单元,常用于实现嵌入式控制功能,具有功能全、体积小、集成度高等特点。在J6中,MCU被集成用以处理功能安全相关的任务,确保系统的可靠性。

这种高集成度的设计不仅提升了系统性能,还显著提高了性价比,降低了部署难度,使得单颗征程6芯片就能够支持包括感知、规划决策、控制、座舱感知等在内的全栈计算任务,适用于多种智能驾驶应用场景。

这种多合一实际上就是SIP(System in Package),SIP技术是一种先进的半导体封装技术,它允许将多种功能芯片、元器件(如处理器、存储器、传感器、RF组件等)以及被动元件(如电阻、电容)集成在一个封装内部,形成一个具有完整或部分系统功能的封装模块。与传统的单一封装只包含一个主要芯片(如SoC)不同,SIP技术通过并排排列、堆叠或采用3D封装等方法,将多个独立的芯片和组件紧密集成,从而实现了更高的集成度和更小的封装尺寸。

总结:本文介绍了地平线公司自动驾驶SoC芯片,尤其是征程系列J6芯片。但是由于地平线的公开信息实在较少,本文仅能基于较少已有信息进行说明,后续如有进一步的公开信息,我会再补充本文内容。

相关推荐
尔呦44 分钟前
Prompt-Free Diffusion: Taking “Text” out of Text-to-Image Diffusion Models
深度学习
好悬给我拽开线1 小时前
【】AI八股-神经网络相关
人工智能·深度学习·神经网络
江畔柳前堤6 小时前
CV01_相机成像原理与坐标系之间的转换
人工智能·深度学习·数码相机·机器学习·计算机视觉·lstm
码上飞扬6 小时前
深度解析:机器学习与深度学习的关系与区别
人工智能·深度学习·机器学习
小达爱学习6 小时前
verilog实现PID控制
fpga开发
逆境清醒7 小时前
开源数据科学平台Anaconda简介
人工智能·python·深度学习·机器学习·anaconda
mm_exploration8 小时前
torch常用函数
pytorch·python·深度学习
FPGAmaster创新者8 小时前
基于AGX ORIN与FPGA K7实现PCIE高速数据通信/Orin与FPGA高速数据传输/XDMA在linux系统使用教程
linux·嵌入式硬件·fpga开发
剑圣土豆8 小时前
大模型LLM面试常见算法题-包括Attention和Transformer常见面试题
人工智能·深度学习·算法·自然语言处理·面试·nlp·transformer
9527华安9 小时前
Zynq系列FPGA实现SDI视频编解码,基于GTX高速接口,提供5套工程源码和技术支持
fpga开发·视频编解码·sdi·gtx