谈一谈自动驾驶中的SoC(转载https://zhuanlan.zhihu.com/p/539628428?utm_id=0)

一 概述

域控制器主要负责自动驾驶感知,决策,执行中的决策,当下是自动驾驶从L2到L3/L4跨越的最关键时期,域控的高光时刻即将来临,即使软件算法还不成熟,硬件预埋也都已经在路上。今天看一下我们在谈域控硬件的时候我们在谈些什么。

二 域控主要硬件模块

从域控制器应用角度,主要是**处理(器),存储,传输(接口)**等性能和参数。

  • 处理, 作为域控制器的运算和控制核心,是信息处理、程序运行的执行单元。需要承担自动驾驶中环境感知和深度学习等超大算力需求、负责控制决策和逻辑运算、以及承担功能安全和车辆控制
    • 分类,
      • CPU(Central Processing Unit), 即中央处理器,是一种通用型处理器,什么都能做,主要负责逻辑运算和决策控制,处理串行计算。
      • **GPU(Graphics Processing Unit),**即图像处理器,相比于CPU而言,GPU的工作更为单一,主要承担大规模浮点数并行计算需求,用于环境感知和信息融合,包括摄像头、激光雷达等传感器信息的处理。
      • **MCU(Micro Controller Unit),**即微控制器(单片机),主要负责可靠性和车辆控制,在高阶自动驾驶上面,负责功能安全(ISO 26262)和冗余监控。车载MCU主要厂家是恩智浦,英飞凌,瑞萨,TI和意法半导体等。
      • **FPGA(Field Programmable Gate Array),**即现场可编程逻辑门阵列,是一种为了满足特定工作内容的半定制处理器。
      • ASIC(Application Specific Integrated Circuit ), 即专用集成电路,是一种为了满足特定工作内容的全定制处理器。例如TPU (Tensor Processing Unit),NPU(Neural Network Processing Unit)。
      • DSP(Digital Signal Processor), 即数字信号处理器,数字信号处理的目的是对真实世界的连续模拟信号进行测量或滤波。因此在进行数字信号处理之前需要将信号从模拟域转换到数字域,这通常通过模数转换器实现。
      • **ISP(Image Signal Processing),**即图像处理器,主要使用硬件结构完成图像传感器输入的图像视频源RAW格式数据的前处理,可转换为多种格式,还可以完成图像缩放、自动曝光、自动白平衡、自动聚焦等工作。
      • 视频压缩芯片等等...
      • **SoC(System on Chip),**即系统级芯片,把一些核心的模块,例如GPU, CPU,ISP,DSP等,都放在一个芯片上。

通用性和大批量生产使电子产品成本大幅度下降,但同时就越难以针对特殊要求加以改变,定制化能实现系统的优化设计,性能优越,但成本会增高。如果除去成本,我们一般用能效比来决定用什么更合适,即做相同的任务消耗更少的是最合适的。

  • 存储, 分为内存和外存,程序的运行都是在内存中进行的,用于暂时存放CPU中的运算数据,内存容量往往有限,需要与硬盘等外部存储器交换数据。
    • 分类,
      • RAM(Random Access Memory), 即随机访问存储器,与处理器直接交互数据,速度快,随机指的是自由指定地址进行数据读写。
        • SRAM(Static Random Access Memory), 即静态随机访问存储器,静态指的是只要通电,就可以正常存储。
        • DRAM(Dynamic Random Access Memory), 即动态随机访问存储器,动态指的是需要定期刷新才能正常存储。
          • **SDRAM(Synchronous Dynamic Random Access Memory),**即同步动态随机存储器,同步指的是利用单一的系统时钟同步所有的地址数据和控制信号。DDR内存条就是这类。
      • ROM(Read Only Memory), 即只读存储器,发展到现在,有些也可以读写。
        • EEPROM(Electrically Erasable Programmable Read Only Memory), 可读可写的ROM.
        • Flash(Flash Memmory), 可读可写的ROM,区别于随机存储,它采用一次读一个block的形式。
          • NOR Flash, 可以直接运行代码的flash,可片上存储,适合代码存储,所以有人喜欢叫PFlash(Program Flash).
          • SPI NOR Flash, 序列接口闪存是一种使用序列式接口(通常使用序列周边接口总线(SPI))来循序访问数据内容,小型且低功率的闪存。
          • NAND Flash, 片外,适合数据存储, 有人喜欢叫DFlash(Data Flash).
      • EMMC(Embedded Multi Media Card), 即嵌入式多媒体控制器,准确的说它是一种内嵌式存储器标准规格,在封装中集成了一个控制器,它提供标准接口并管理闪存(自带内存管理)。
      • UFS(Universal Flash Storage), 是由多个闪存芯片、主控、缓存组成的阵列式存储模块。(自带内存管理)
  • 接口, 连接其他设备。
    • 分类
      • 外部
        • GMSL(Gigabit Multimedia Serial Links),即千兆多媒体串行链路,是一种高速串行接口,适用于音频,视频和控制信号的传输。通信介质支持同轴电缆以及屏蔽双绞线,其核心技术为串行器/解串器技术,首先通过串行器将并行数据流转为串行数据流,然后通过更高的频率进行传输,之后通过解串器将接收到的串行数据流转换为并行数据流。
        • Ethernet, 以太网,当下主流的车载以太网协议主要为IEEE 100BASE-T1以及IEEE 1000BASE-T1,车载通信方式之一,也可用于多媒体。
        • **CAN(Controller Area Network),**一种共享式双线串行通信总线,具有非破坏性仲裁,分布式实时控制,可靠的错误处理和检测机制等特性。最高通讯速率可达1MBit/s,CAN网络的优势是成本低,可靠性高,不足之处是CAN总线属于共享式总线,通信速率相对较低。
        • **CAN FD(CAN with Flexible Data-Rate),**CAN的替代总线,在继承了CAN总线的绝大多数特性的同时,弥补了CAN总线在总线带宽和数据长度的不足,将数据位最大的字节数提高至64位,最高通讯速率可达8MBit/s甚至更高,显著提高了通信速率,降低总线负载。CAN FD可以兼容传统CAN网络。
        • **LIN(Local Interconnect Network),**一种低成本的串行总线技术,LIN总线网络采用单主多从的模式架构,使用单信号线进行传输,主、从节点间的通信有具体的规则,只有主节点需要,从节点才能发送信息,不需要总线仲裁。LIN总线最主要的优势在于相比CAN总线更为低廉的成本,带宽仅有不到20KBps,多应用于带宽要求不高的舒适系统。
        • **Flex Ray,**属于共享式总线技术,带宽可达10Mbps,是一种具备时间可确定性的、分布式时钟同步的、故障容错的总线标准。Flex Ray的主要优势在于相比CAN总线具有较高的带宽,但是其成本却很高。
        • **MOST(Media Oriented Systems Transport),**汽车领域的多媒体应用通信标准,以解决传统总线不适用于汽车娱乐信息传输的不足。由于MOST通信物理层使用的是光纤传输,采用环形网络拓扑结构,其线束质量轻、抗干扰性强、带宽高、信号衰减少,最新的MOST-150标准速率可达150MBit/s,可同时传输音像流数据、文件数据等。但是它的扩展性差,技术开发周期长,专利技术成本昂贵,难以得到普及。
        • **LVDS(Low Voltage Differential Signaling),**最高带宽可达655 Mbps,是一种低压差分高速信号标准,属于点对点的图像传输技术,每个接口只能有一个摄像头或者一个视频输出口,严重限制了扩展性能。
        • DSI3,一种接口协议,一般用作USS通信使用。
      • 内部,
        • SPI(Serial Peripheral Interface), 即串行外设接口,是一种同步串行数据传输标准。
        • I2C(Inter IC Bus), 即IC之间的总线,是一种两线式串行总线,用于连接微控制器及其外围设备。
        • UART(Universal Asynchronous Receiver Transmitter), 即通用异步收发器,它把将要传输的资料在串行通信与并行通讯直连加以转换。
        • MIPI(Mobile Industry Processor Interface), 即移动产业处理器接口,目的是把内部接口如摄像头、显示屏接口、射频/基带接口等标准化,从而减少设计的复杂程度和增加设计灵活性。MIPI联盟下面有不同的WorkGroup,分别定义了一系列的接口标准,比如摄像头接口CSI 、显示接口DSI 、射频接口DigRF 、麦克风 /喇叭接口SLIMbus等。统一接口标准的好处是手机厂商根据需要可以从市面上灵活选择不同的芯片和模组,更改设计和功能时更加快捷方便。
        • GPIO(General-Purpose Input/Output), 主要根据Pin的电平高低,自定义信号属性。
        • 等等等等。。。

三 域控主要参数

  • 处理
    • **TOPS(Tera Operations Per Second),**1TOPS代表处理器每秒钟可进行一万亿次(10^12)操作,神经网络(NPU)算力指标,主要是真INT 8运算。
    • FLOPS(Floating Point of Per Second), 传统GPU算力指标(CPU也能干这事),它的意思是指每秒浮点运算次数。
      一个MFLOPS(megaFLOPS),每秒一佰万(=10^6)次的浮点运算,
      一个GFLOPS(gigaFLOPS),每秒拾亿(=10^9)次的浮点运算,
      一个TFLOPS(teraFLOPS),每秒万亿(=10^12)次的浮点运算,
      一个PFLOPS(petaFLOPS),每秒千万亿(=10^15)次的浮点运算
    • DMIPIS(Dhrystone **Million Instructions Per Second),**字面理解为百万条指令/秒,CPU算力指标,主要是逻辑运算。
    • **GHz,**主频, 始终频率,计算机的操作在时钟信号的控制下分步执行,每个时钟信号周期完成一步操作,时钟频率的高低在很大程度上反映了CPU速度的快慢。1 Hz是1秒1次,1PHz = 1000THz, 1THz = 1000 GHz, 1GHz = 1000 MHz, 1 MHz = 1000kHz, 1 kHz = 1000 Hz.
  • 传输
    • 带宽(总线带宽),总线在单位时间内可以传输的数据总量,等于总线位宽与工作频率的乘积。例如:对于64位、800MHz的前端总线,它的数据传输率就等于64bitx800x1000x1000Hz÷8(Byte)÷1024÷1024 ≈ 6.0GB/s。
  • 存储
    • 容量,GB, MB, KB, B是Byte.
相关推荐
古希腊掌管学习的神1 小时前
[搜广推]王树森推荐系统——矩阵补充&最近邻查找
python·算法·机器学习·矩阵
martian6651 小时前
【人工智能数学基础篇】——深入详解多变量微积分:在机器学习模型中优化损失函数时应用
人工智能·机器学习·微积分·数学基础
人机与认知实验室2 小时前
人、机、环境中各有其神经网络系统
人工智能·深度学习·神经网络·机器学习
黑色叉腰丶大魔王2 小时前
基于 MATLAB 的图像增强技术分享
图像处理·人工智能·计算机视觉
迅易科技5 小时前
借助腾讯云质检平台的新范式,做工业制造企业质检的“AI慧眼”
人工智能·视觉检测·制造
古希腊掌管学习的神6 小时前
[机器学习]XGBoost(3)——确定树的结构
人工智能·机器学习
ZHOU_WUYI6 小时前
4.metagpt中的软件公司智能体 (ProjectManager 角色)
人工智能·metagpt
靴子学长7 小时前
基于字节大模型的论文翻译(含免费源码)
人工智能·深度学习·nlp
AI_NEW_COME8 小时前
知识库管理系统可扩展性深度测评
人工智能
海棠AI实验室8 小时前
AI的进阶之路:从机器学习到深度学习的演变(一)
人工智能·深度学习·机器学习