自动驾驶传感器:传感的本质

自动驾驶传感器:传感的本质

附赠自动驾驶学习资料和量产经验:链接

0. 前言

这个系列的背景是:工作时候需要攒一台数据采集车辆,那段时间需要熟悉感知硬件,写了不少笔记,都是些冗长的文章,感兴趣的收藏起来慢慢看。写的太多不保证准确性,发现硬性错误可以评论、私信。

文章目的是对自动驾驶车辆感知层硬件 进行介绍和分析。我希望能够从更本质的层面去将所有的自动驾驶传感器串联起来,从物理角度对传感器形成更加系统性的认识。

文章会尽力避免陷入"罗列传感器种类、品牌、参数、技术路线、优缺点" 的风格,而会专注于真正 "理解" 传感器,认识传感器所具备"优点""缺点"背后的原理。

本文基于2022Q1的硬件产研情况,随着时间推移业界也会有新的进展,因此一些结论会随时间而变化。

另外,全文较长,可以跳跃看。涉及到的知识面比比较发散,但限于自身水平,并不会深入。一些概念可借助wikipedia、百度百科理解。

另外,我将本文的Radar和Lidar原理单独拆分出了两篇文章,便于精读和进行公式推导,这篇文章可以泛读。


1. 传感器的物理特性

1.1 汽车传感器的共同点

我们可能听了无数次,用于自动驾驶系统的传感器有:超声雷达、毫米波雷达、激光雷达、相机(可包含红外相机),同时GNSS-RTK模块V2X通信也都可以视为特殊的传感器。

也无数次听到别人这些传感器的特性介绍:什么激光雷达精度高、毫米波雷达穿透性好、照相机能提供语义信息 bla bla bla。那么问题来了:这些传感器的共同点是什么? 或者说,这些传感器依靠何种方式来传递信息?造成这些传感器性能差异的原因又是什么?

奥迪A8的传感器布置

统一答案是:振动的传播 ------波的特性,这就是上述传感器的物理学本质。除了超声雷达依靠的是空气介质中机械波的传递,余下的传感器都是依靠电磁震荡产生的**电磁辐射(电磁波)**来传递信息。那么,我们先来复习一下电磁波。

1.2 传递信息的电磁波

电磁波(Electromagnetic wave) 是由同相且互相垂直的电场与磁场在空间中衍生发射的振荡粒子波,是以波动的形式传播的电磁场。其传播方向垂直于电场磁场构成的平面。电磁波在真空中速率固定(光速不变原理,By Einstein,1905)。电磁波具有波粒二象性,其粒子形态称为光子------百度百科

1820年,丹麦科学家奥斯特 发现了:随时间变化的电流能够产生变化的磁场;1832年,英国科学家法拉第又发现:变化的磁场又能够产生变化的电场。那么,人们自然联想到,电生磁-磁生电的过程可否循环交替进行呢?1865年,**麦克斯韦预言了这种电磁波的存在;**最终由德国科学家赫兹在1888年证明其存在。(从此Maxwell能够位列仙班,与牛爵爷同属人类历史第一梯队的物理学家)

而电磁波产生的原理,正如同人们所猜想的那样:电生磁-磁生电,并沿着垂直于电磁和磁场构成平面 的方向传播。如此优秀的特性几乎是为了传递信息而设。

电磁波的定义

电磁波的 频谱 中包含了 频率从低到高的电磁辐射,有长波(<300kHz)、 短波(3-30MHz)、微波(300MHz-300GHz)、红外线(0.3THz~380THz)、可见光(380~750THz)、紫外线、X射线、γ射线(>10^18Hz,现有理论只能支撑大于"普朗克长度"的波长)。

电磁波频谱,可见光只占很小的部分

这也就意味着,美军用于 与万公里外海底潜艇通信的76Hz 长波雷达,拍摄胸片的高频X光,以及人眼所及的可见光本质上都是电磁波,其物质体现都是光子,区别仅是 波长 或 频率。

长波雷达、可见光、与X光片

回顾高中知识,波长 ,其中 c 是光速,f 为频率。这也就意味着频率越高,电磁波的波长越短,在环境传播中产生的衍射也也更少。如此会带来三个结果:

  1. 波的传播越趋于直线,其误差更小,定位相对精确;

  2. 电磁波更容易被物体阻挡,环境中的传播距离更短;

  3. 频率更高,传输信息的效率也越高,包含能量也越高。

一个非常直观的例子就是,5G比4G传输效率更高,但需要建设更多的基站,单体基站的能耗也更高。以上三个结果基本可以解释所有传感器的差异。

1.3 车用传感器波长的选择

电磁波自第二次工业革命来,就被广泛的应用于信息的传输与接收。不例外的是,自动驾驶所用的传感器同样是利用了电磁波,其不同点在于收发电磁波的工作频段不同

那么,在作为信号载体的电磁波波长范围 应当如何选择? 先从需求端出发:自动驾驶车辆需要对 ~300m内的环境要素进行感知,关键的 ROI 感知分辨率应当达到厘米级。其次,车辆本身的定位精度也需要达到厘米级。

对于电磁波,波长越长,其探测精度和分辨率也就越低。而且,物理天线的大小同电磁波的波长成正比(一般为λ / 4)。我们更不能指望自动驾驶汽车扛着一个好几米的传感器前进。因此,波长的下限也就基本被限制在毫米波。

当然,频率的上限也不能一直提高,根据电磁波的能量公式: ,紫外波段之后的电磁波对人体的伤害会大幅提高,制造成本也会大幅提高。且制约于**扫描技术(机械扫描、电子扫描)**的短板,目前的技术水平并不能发挥其物理极限。

而且,更短的波长使其更容易被大气中的悬浮物阻挡,探测距离变得更短这一点在激光雷达、相机上已经有所体现 ,微米级的PM2.5浮尘、雾天的水汽足以阻挡波长数百纳米的可见光和红外激光。相对地,毫米波则可以轻松绕开这些障碍。这也就是"相机、激光雷达在恶劣天气无法工作" 的本质原因,不以技术提高为转移。

局座:雾霾可以抵挡激光武器

可以说:并非自动驾驶汽车主动选择了毫米波雷达、激光雷达、相机等传感器。而是汽车的 感知需求 与 电磁波的物理特性,使得这些选择成为了必然。

接下来就可以分别讨论 自动驾驶用到的各种传感器。

参考资料:
Electromagnetic radiation - Wikipedia电磁波_百度百科 (baidu.com)James Clerk Maxwell - WikipediaSelf-driving car - Wikipedia普朗克长度_百度百科 (baidu.com)

2. 毫米波雷达 Millimeter Wave Radar原理

Radar是 Radio detection and ranging 的简称,即**"无线电探测和测距"。常用车规级雷达频率为24GHz和77GHz,对应的波长为12mm、4mm**。为什么采用这两种频率,而不采用其他频率的毫米波?别瞎想,这不是因为什么特别的技术原因,纯粹就是因为频谱资源不够用。

电磁波的每一个频段都会按照规定,分配给特定的设备 or 行业,以防止设备信号之间的相互干扰 。这个分配工作是由国际电信联盟_百度百科 (baidu.com)来制定。目前的频段分配十分的紧张,联想一下前几年各国对5G频段的争抢,就不难理解。而24GHZ和77GHz就是国际电信联盟专门划分给车用雷达的频段。

毫米波雷达技术已经相对成熟,特别在军事层面。当前制约车规级毫米波雷达的,主要是性能与体积、成本之间的平衡。

2.1 雷达基础原理

雷达的原理非常朴素易懂:对目标发射电磁波 > 接收反射回波信号 > 测量回波的时间、相位等信号 > 解算目标的距离、速度、角度信息。其衡量指标无非就是量程分辨率。

雷达原理

2.1.1 天线

根据电磁波的产生机理,雷达首先需要一个能够产生高频交变电流的装置,这部分用到压控震荡装置(VCO,voltage-controlled oscillator),输出的震荡频率会随着输入电压而改变(简单类比、回想大学《数字电路》中的555震荡电路)

然后利用发射天线 将高频电流转化为向空间发射的电磁波。接收天线与发射天线是互逆的,天线同样可以将空间中的电磁波转化为交变的电信号。

天线产生电磁波的原理

2.1.2 距离测量:脉冲与FMCW

  • 脉冲雷达

距离测量的方式很容易想到,雷达发射一个脉冲 ,测量脉冲信号从发射到返回的"飞行时间Time of Flight"即可得到。

  • 调频连续波

当然,实际上车用雷达并不用这种方式,而是采用 "调频连续波FMCW------Frequency Modulated Continuous Wave"。雷达发射的频率呈线性变化,其回波信号也呈线性变化,通过测量当前发射频率与接受频率之差,可得到探测物体的距离,具体的公式推导后面会给到。

连续调频脉冲测距原理

2.1.3 速度测量:多普勒效应

雷达速度测量基于多普勒原理(Christian Johann Doppler,Austria,1842 )。简而言之:观测者向着波源运动时,波被压缩,观测到的频率变高;观测者背离博源运动时,波被拉长,观测到的频率变低。

多普勒原理

速度引起的频率偏移是: ,依据频率偏移即可计算出目标的相对运动速度。

2.1.4 角度测量:大锅盖 vs MIMO

衡量角度测量的一个重要指标是角分辨率,即两个最小可辨目标之间张角的大小。例如,雷达横向角分辨率为1°,则代表在100m范围内,雷达的"像素"大小为1.74m。如果这时有相邻的两个0.5m的目标,雷达是无法识别的。

自动驾驶要求尽可能高的角分辨率,该怎么办?一个简单的想法是,让发射的电磁波波束尽可能窄,方向性高。此时雷达地角分辨率就是电磁波的波束宽度,配合扫描机构即可实现一定范围内的视场角。激光雷达就是这个原理。

然而,这对于普通雷达是极为困难的。一个简单的点源天线的辐射波形,是趋近于球面波的,我们需要对天线进行设计,才能使其波瓣宽度减小(天线增益大,传播距离也远)。一般天线的波束宽度为: θ≈λ� ,其中D为天线口径。**天线物理尺寸越大,雷达波束指向性才越强。**且天线是无法达到如激光一样 高度一致的方向性的。(激光原理文章后面会提到)。

定向天线辐射示意图,孔径越大,方向性越好

汽车显然不可能顶着一个大锅盖扫描雷达行驶。事实上,车用雷达往往采用的都是贴片天线(CMOS技术),其成本更低、体积更小,其波束宽度基本都在30-60°之间。通过限制波束宽度来测角的方案,自然破产了。

"大锅盖"机械扫描雷达

车用雷达的贴片天线与波束宽度

那么,如何通过有限的设备获得较高的角分辨率?工程上最朴素的想法就是,采用多套设备换个位置多测几次,然后通过接收信号的差异解算角度(解算过程在后面)。这也就是MIMO(Multi-input Multi output)技术的核心思想,结合了MIMO + FMCW的雷达也是车用毫米被雷达的最主流的方案。

2.2 FMCW 汽车雷达的原理

此部分内容涉及理论+公式推导,主要来源 为TI手册,不感兴趣可以不看。

基础概念:

射频 Radio Frequency------负责接收及发射高频信号

中频 Intermediate Frequency------射频与基频的桥梁,使信号由高频信号转成基频

基带 Baseband------负责信号处理及储存等功能

2.2.1 调频连续波的测距原理

如前面所言,雷达发射的调频信号的频率在其持续时间Tc内呈线性关系。其主要参数有:信号带宽B 、斜率S、持续时间Tc。

· 目标的距离解算

连续调频脉冲测距原理

那么,雷达发射信号与回波信号进行混频,得到其差值,就是一个**特定频率中频信号IF。**该信号的频率与目标距离成正比。将该IF信号由ADC模块采样后转换成数字信号,即可解算获得距离信息。

· 多个目标的检测

如视场内有多个目标,接收器会接收到多个反射波,中频信号IF则是由多个正弦波叠加而成。此时的做法也很简单,只要对该叠加的IF进行傅里叶变换,从信号的频谱即可得到多个频率峰值,进而计算多个目标的距离。

接收到的多个中频信号

· 探测距离范围

制约探测距离的因素主要是ADC采样频率 。根据奈奎斯特采样定理: "在AD转换过程中,采样频率 大于信号中最高频率2倍时,采样后的数字信号完整地保留了原始信号中的信息(一般用2.56~4倍)"。也因此,中频信号 �� 的上限,也就是可探测距离的上限,主要受ADC硬件的限制。

**注意:该探测距离是雷达的理论值。**实际工作中,探测距离会受到设备输出功率、天线增益、目标雷达横截面等参数影响。从式(3)还可看出,调频波持续时间 越短,相应的探测距离变小,但探测的周期也会缩短。

Fourier变换原理,by Heinrich(知乎)

· 距离分辨率

距离分辨率是雷达辨别多个物体的能力,当两个物体靠近到一定程度,雷达就无法识别出这是两个物体。体现在雷达信号上,就是两个中频信号的频率相差很小,傅里叶变换无法将两个频率的峰值区分开。

"融合"与"可识别"的峰值

2.2.2 测速原理

测速利用的相位差

  • 目标的速度解算

当雷达视场内 速度不同的多个物体与雷达的距离相同时候,前面提到的双线性调频脉冲就失效了。FFT的相位谱的峰值混合叠加了多个物体的信号,无法分辨。

比如,当前有两个同位置的物体。此时,雷达需要发射一组N个(N>2)、等间隔的线性调频脉冲,称之为脉冲帧。

脉冲帧

在一个脉冲帧内的数据,可以产生N个频域相同的峰值,但N个峰值的相位却不同,叠加了两个物体的相位成分(下图的红色、蓝色箭头)。

那么如何将**"叠加的相位"** 拆开?对N个相位数据再做一次FFT。

相位数据的FFT结果,区分两个物体的相位

2.2.3 测角原理

  • 目标的角度解算

前面说过,车用雷达测角需要两个以上的RX天线,单发单收是无法实现角度估计的。其原理是:物体与两个天线的距离差 会导致FFT峰值的相位变化。

两个天线

平面波假设

2.3 MIMO技术

2.3.2 MIMO技术的应用

那么,看起来就剩下一条路可走:**增大采样通道数量,也就是多输入多输出(MIMO)雷达。**MIMO雷达拥有多个发射天线TX 和多个 接收天线RX,用户即可生成一个 N = nTX × nRX的虚拟天线阵列。

MIMO技术的应用

  • 增加接收天线RX

以单发4收为例,此时N = 4。后面的每一个天线相对于前面一个,多了一个相移ω,呈线性增加。通过对N个天线的信号进行采样,可以形成相位信号序列的FFT。接收天线越多,角度的峰值就越尖锐,ω的分辨率越高。

角度分辨率随RX增多而提升

应用MIMO雷达技术,可以倍增虚拟天线的数量,相应地也提高了角度分辨力。MIMO 雷达的原理,可以扩展到多维阵列。

  • 增加接收天线RX

每增加一个RX天线,都要配备独立的RX处理链(各配有一个LNA、混合器、IF滤波器和ADC),显然一直增多RX天线并非好的做法,增加发射天线是更高效的方式。M个天线发射相互正交的信号,多波形信号在空间保持独立。N个接收天线采用M个匹配滤波器对回波进行匹配,从而可以得到M*N个通道的回波数据。

多个TX

相应地,RX天线上接收TX2发射信号的相位为[4ω 5ω 6ω 7ω]。2发4收的雷达通道数N = 8,与单发8收的雷达等效。

当然,由于不同TX发射的信号为正交信号,因此无法像相控阵雷达那样,通过波束形成在空间功率合成,单个发射波束的主瓣增益将降低1/M。

2.4 电扫描:相控阵技术

2.4.1 相控阵原理:电磁波的干涉

对军事感兴趣的应该常听一个概念**"相控阵雷达"(Phased Array Radar,PAR)**。所谓相控阵雷达,同样用到了多个单元,类似昆虫的复眼,每个单元都可以单独收发电磁波。

军用相控阵雷达

当这些独立的单元同时向外发射电磁波时,就会发生干涉现象。使得某一方向的电磁波加强,或使得某一方向的电磁波相互抵消。所谓"相控阵",就是对每一个发射单元的相位进行控制,使发射波在空间进行功率合成,从而形成特定方向的电磁波。

通过改变发射阵列中的相位,生成的波束即可对空间扫描,而不需要旋转雷达本体。此时,雷达的视场(FOV)就与天线的波束宽度没有直接关系了。

相控阵原理:波的干涉

2.4.1 PAR与MIMO的区别

虽然同是基于多天线阵元结构的雷达系统,相控阵与MIMO是有明显区别的。首先相控阵的阵元间距通常是波长量级的,为了防止出现栅瓣,通常间距设置为 �/2 。通过调节移相器,可以获得预期方向的窄波束。

而MIMO雷达的天线发射阵元间距并没未特别限定,可以是密集或稀疏的,更大的区别是MIMO是发射正交波形,且可以自由选择波形。其合成发射方向图的可控自由度远大于相控阵雷达。这种波形的分散、集合,使得MIMO雷达比一般相控阵雷达具有更好的性能。

MIMO雷达通过采用稀疏布阵,可得到最大的连续虚拟孔径,提高空域分辨率,在测角方面具有较强的优势。

也因此,事实上车用雷达一般多采用FMCW+ MIMO技术,很少采用PAR。

2.5 Radar的尴尬现状

毫米波雷达能够作为主流的自动驾驶传感器之一,具备了两个不可替代性:

1. 相比LiDAR,Camera,毫米波雷达具有可以测量目标的相对速度。(实际上激光雷达也可以办到,但车用LiDAR侧重并不在此)

2. 恶劣天气中,Radar是唯一能够有效感知环境的传感器。

但当前,毫米波雷达仍然面临比较尴尬的现状。2021年7月,Tesla在最新的 FSD Beta V9中取消了毫米波雷达,仅采用视觉+超声的感知方案。毫米波雷达价格谈不上昂贵,Tesla出于降本的动机应该不大。

主要是因为,毫米波雷达在实际应用层面存在一些问题,当前主流车用毫米波雷达没有高程信息。以TI的AWR1843为例,其天线设计为3发4收,布置在水平面上。

德州仪器 AWR1843

所有高度的物体反射波都被投影到了垂直平面。这意味着:如果前方有一个路牌or 龙门架,毫米波雷达会反馈前方有障碍物,但并不能确定"障碍"是在空中还是在路面

如此一来,**关于静态物体的探测结果的可置信度就大大降低。**因此,实际应用中,**工程师往往将毫米波雷达检测到的静态目标进行滤波,只保留动态目标的追踪结果,**这也就是盛传的"毫米波无法检测静态物体"说法的来源。其实不是不能检测,而是由于高程的不确定而舍弃掉了。

这就带来一个很大的隐患,如Tesla在山景城、嘉义市的事故,都是撞上了白色的集装箱车辆。首先,毫米波雷达必定检测到了前方的静态障碍,但被系统过滤掉了。对着白色的集装箱,Camera又无法获得足够的特征对其进行识别,Tesla又没有LiDAR能够探测距离,于是------卒。

Tesla的事故

一些做自动驾驶决策的工程师表示,目前的毫米波雷达数据的确非常难以融合,信息量相对较少,数据质量还往往不高,颇似鸡肋。

Masking by Moving: Learning Distraction-Free Radar Odometry from Pose Information - YouTube

2.6 4D 毫米波雷达

2.6.1 4D毫米波雷达原理

毫米波雷达难用的一大重要原因就是:不具备高程信息。人们自然联想到:**在垂直方向上也布置收发天线,给它加上高程信息不就行了?**如此一来,路面的静态物体就不会被漏掉了。但其难点在于,天线在垂直与水平方向天线紧密排布会相互产生严重的信号干扰。

水平+垂直方向的收发,From Arbe Phoenix

自然也有厂商做出了这方面的努力,开发了**4D FMCW MIMO High Resolution Radar,即所谓的 "4D毫米波雷达"。**4D指的是3D的坐标信息+速度信息。Conti(ARS540),TI,华为,以色列的Vayyar,Arbe 等公司都发布了4D毫米波雷达产品。其原理不外乎采用MIMO继续增多收发天线的阵列。

比如华为在2021年发布了12TX,24RX的4D成像雷达(未量产)。业界跳的比较欢的,当属Arbe的旗舰产品Phoenix,具备了48发,48收,一共2300个信道,性能远超一般的3发4收的现行产品。Arbe宣称其产品具备:1°的横向角分辨率和2°的纵向角分辨率,100°的水平视角和30°的垂直视角,2K点云,其成本能控制在150USD以内。

Arbe 4D毫米波雷达技术参数

下方是Arbe于2020年底给出的产品测试Demo。

Arbe: Radar Revolution. Delivered. - YouTube

从视频中可以发现,尽管其3D点云和仍然很难称之为"密集",但已经可以对行人、车辆做出追踪;对垂直方向上的龙门架、立交路面做出精确判断。其数据与Camera,LiDAR的可融合性大大提升。

Arbe甚至吹嘘其产品可以挤占激光雷达的市场,吹牛博眼球的成分较大。**由于雷达的发射原理,以及毫米波物理极限的限制,**4D毫米波雷达不大可能形成足够密集的点云,其信息丰富度不足以独立支撑自动驾驶车辆。

更何况,基于FMCW技术的4D激光雷达目前也在研发中,其同样能够提供速度数据,文章的后面会提到。同样如果能够成功的话,也会挤占毫米波雷达的生存空间。

另一家以色列的公司RFIsee,则开发出了基于相控阵技术的4D雷达。

RFISee Radar Output 2 1 - YouTube

2.6.2 2022.07.26 长安深蓝SL03 森斯泰克

2022.07.25日,长安深蓝发布的第一款增程混动车型SL03是中国第一款搭载4D毫米波 雷达的车型,供应商为国内厂家森思泰克,其可在水平120°、纵向30°的视场中提供1.2°水平 x 2.5°纵向的角分辨率,即一帧包含1200个点

长安深蓝SL03

森思泰克4D成像雷达效果

对毫米波雷达的讨论篇幅极长,但这是有必要的。其中,对FMCW、多普勒效应、MIMO、相控阵的原理解释,也有助于理解后续的内容。

疑问:

A. 雷达天线应当如何设计才能减小波瓣宽度,是否有简单通俗的举例?

B. 思考:脉冲毫米波雷达因为何种原因存在盲区、模糊?为何FMCW的激光雷达不存在盲区?

(原因:1、方向分辨率差异;2、脉冲重复频率(PRF))

3. 激光雷达 LiDAR原理

激光雷达Lidar 是Light detection and ranging的简称,即**"激光探测和测距"**,其工作模式同样是 **发射-反射-接收-计算,**当然各个环节上同Radar的实现方式不大一样。

几年前第一次听到 "激光雷达" 的概念时候,我的第一印象并非极富科技感的3D点云,而是想起小时候被人用激光电棒晃眼睛的恐惧,进而联想到汽车顶着一个大号激光电筒把我晃瞎的情形。事实上,车用LiDAR的激光波长属于处于人眼看不到的红外线波段。(但这也不代表红外线对人类眼睛无害,尤其是接近可见光的905nm激光,需要对其功率做出限制)

LiDAR点云

***注:**对于激光雷达的介绍,太多文章互相抄来抄去,而对于底层的原理分析并不透彻。并且总是从投资者的角度出发,过多关注企业的经营状况和投资意见。而作为自动驾驶的从业者,追踪厂家的产销情况是没有多少意义的,这些信息总会随着时间流逝而不断变化。我们只需要知道当前激光雷达工作的最基本的原理:

  1. 原子的受激辐射原理;(根本的物理学原理)

  2. EEL、VSCEL、光纤激光器的原理;(激光发生器件的基础原理)

  3. PD、APD、SPAD、SiPM原理;(激光接受器件的基础原理)

  4. 机械式、棱镜、转镜、MEMS、OPA相控阵、FLASH;(让激光完成扫描的原理)

  5. ToF、FMCW的测距原理;(激光测距的原理)

所谓市面上的激光雷达,无非就是以上技术原理的排列组合而已。熟悉于原理才能一眼看透背后的本质,后面也就不会迷失在一些报告的胡吹乱侃中。

激光雷达的可行技术路线

3.1 LiDAR的基础物理学原理

3.1.1 原子能级与自发辐射

前面提到,雷达发射的电磁波,本质上是由交变电流转化而来 。而到了光波,人类目前并没有能力制造数百THz的交变电流从而产生电磁波,此时就需要借助原子来产生光波。

再次将视角切回高中,丹麦物理学家玻尔 提出了原子的能级结构即原子只能处于一系列不连续的能量状态中,而不能处于中间的状态,原子不同能量状态对应于 电子不同的运行轨道(1s 2s 2p 3s 3p 3d ...)。

光子、电子轰击、外部加热等作用下,原子会从低能级跃迁到高能级(激发态 ),而激发态原子又会自发的向更稳定的低能级跃迁,此时能量会以光子的形式发射出来。在此过程中,不同原子产生的自发辐射光在频率、相位、偏振方向及传播方向都有一定的任意性 ,我们称之为自发辐射(spontaneous emission)。

这其实就是我们日常生活中白炽灯、节能灯管、LED灯的发光原理。例如节能灯管就是电子轰击汞原子,汞原子产生紫外线,紫外线照射荧光物质最终产生可见光。

汞原子能级

3.1.2 受激辐射与激光

还另一种更有规律的辐射方式:受激辐射(Stimulated emission)。当激发态原子处在外来电磁辐射场的作用下,而这个外来光子的能量恰好又是原子两 能级的能量差。这个时候,会引起类似 "雪崩"的效应,众多激发态原子发出的光子的频率、相位、传播方向、偏振状态与外来光子完全相同

此理论由爱因斯坦在1917年在《关于辐射的量子理论》中发表。

激光就是 Light Amplification by Stimulated Emission of Radiation (受激辐射光扩大)的简称。而后受激辐射会经过一个谐振腔 。基础的谐振腔由两片平行的反射镜构成,一片为全反射,另一片部分反射。那么,其结果是:方向不沿轴线的激光会被滤除,而沿轴线的激光则会被加强。向外输出的就是 波长一致、方向一致、波束极窄的光------激光。

谐振腔原理

这种一致性是极其宝贵和罕见的 ,普通雷达天线发射的电磁波无论如何都做不到在方向上的高度一致。而激光具备的方向性和波束宽度,使激光雷达的角分辨率可以暴打其他传感方式。

3.1.3 激光器件的种类

至于车用激光器的种类,大概有以下三种:

  1. 边缘发射激光器(Edge Emitting Laser,EEL ):

发射功率大,"纺锤状"光斑。

**2. 垂直腔表面发射激光器(Cavity Surface Emitting Laser,VCSEL ):**发射光束窄且圆,**易于实现芯片上的大规模阵列(十分重要)。**缺点:当前器件功率略低,探测距离短。单轴转镜雷达以及Flash激光雷达都会采用VCSEL,这将会是未来的主要方向。

比如,Iphone搭载了VCSEL激光雷达,Face ID即基于激光雷达的人脸扫描识别。2022新上市的禾赛AT128同样采用了128个集成的VCSEL激光器。

3. 光纤激光器

EEL vs VCSEL

  • 905nm激光与1550nm激光

激光的波长很大程度上与激光器自身的物理性质相关(还与环境温度等参数相关)。比如,硅激光器 中心频率为905nm,磷化铟激光器中心频率为1550nm。

显然,相对于905nm激光,1550nm激光的绕行能力相对好一点,对空气中的尘埃颗粒有一定克制作用。远离了可见光范围,其激光器的功率也能做的更大一些,探测距离也相对更长,可达到500m。1550nm激光雷达是一个大的趋势,不过磷化铟激光器和砷化镓APD也比硅激光器更贵些,不过这并不是什么大问题。

水对于1550nm激光的吸收作用非常强,对人眼伤害小也是因为在到达视网膜前被眼球中的水分吸收了。因此雨天里1550nm的激光雷达受影响较大

REF:
Vertical-cavity surface-emitting laser - WikipediaLaser diode - Wikipedia

3.1.4 激光接收器件原理

  • 光电二极管

那么问题又来了:**激光又应该如何感知呢?**前面提到Radar的接收器利用了天线的互逆性质,将电磁波转化为同频率的交变电流信号。然而,该方法对激光是无法实现的。我们需要新的方法转换激光信息:光电效应。

在高于某特定频率的电磁波(该频率称为极限频率Threshold frequency)照射下,某些物质内部的电子吸收能量后逸出而形成电流,即光生电。

光电现象由德国物理学家赫兹于1887年发现,而正确的解释由爱因斯坦提出,闭环了属于是,爱因斯坦也因此于1922年获得诺贝尔奖。

又是我!

光电二极管 在设计和制作时尽量使PN结的面积相对较大,以便接收入射光。光电二极管是在反向电压作用下工作的,有光照时,反向电流迅速增大到几十微安,称为光电流 。光的强度越大,反向电流也越大。光的变化引起光电二极管电流变化,这就可以把光信号转换成电信号,成为光电传感器件。

其响应度可以定义为给定波长下,产生的光电流(I)和入射光功率§之比: �(�)=���� (26)

对入射功率的线性响应 ,可以为后续的AMCW测距提供良好保障。

硅光电二极管

具体到激光雷达,一般采用的器件是雪崩光电二极管(APD)、单光子雪崩二极管(SPAD)、 硅光电倍增管**(SiPM),**器件具体的原理参考WIKIPEDIA,本文不做详细阐述。

  • 激光的混频与干涉

光电二极管能够探测到的信息有:激光的有/ 无,强/ 弱。如需测量激光的频率和相位等信息,则需要激光干涉仪 以或者光谱仪 。这在激光雷达上是不现实的。因此,实际上FMCW激光雷达会采用间接测量的方式,通过入射-接收激光混频的方式的到频率、相位信息。

Ref:
Photoelectric effect - WikipediaPhotodiode - WikipediaAvalanche photodiode - Wikipedia

3.2 车用激光雷达需求

在自动驾驶行业,车载激光雷达的应用场景主要是自动驾驶开发验证、Robotaxi、高精地图采集、以及量产车型的感知模块。其中,尤以量产项目 能够带来大量的订单,为厂商创造大量利润。而量产车型的激光雷达,其要求同样也是最为苛刻的:汽车作为"用户",到底想要什么样的激光雷达:

要求 说明
成本可控 作为汽车的零部件,其成本不能太高,至少控制在几百美元内;
体积小 体积不能太大,便于在车身上的布置;
测量距离可达200m以上 自动驾驶合理的探测范围需求;
精度可达厘米级 同上;
测量响应快,时间短 只有单点探测速度足够快,才能形成足够密的点云
对人眼安全(硬性) 法规硬性要求,激光能量不能过高,否则对人眼产生伤害;
满足车规级要求(硬性) 满足车规级的13000小时的工作寿命需求,以及-40-85°C的工作温度要求,需要可靠性极高;

激光雷达的需求

可见,激光雷达需求的维度是比较高的,事实上同时达成这些需求也非常困难。带着这些需求,去讨论现有的LiDAR的方案,这样就不会迷失在 罗列参数、优缺点 的陷阱中。

3.3 激光雷达的测距方案

激光雷达的方案分为两种:**"测距方案""扫描方案",**两者有一定的关联性,但却是不同的概念,不能混淆。因此分开讨论。

3.2.2 TOF测距法:时间测量

3.2.3 三角测距:Camera传感

激光发射器发射激光,打在物体上的反射光被CMOS或CCD传感器捕获,传感器可以是线阵相机 or面阵相机。采集到的光斑图像,可以利用灰度质心法可求得sub-pixel级别的分辨力。(双目视觉其实也可归结为是三角测距)

三角测距原理:斜射式

三角测距优点:

  1. 近距离下的探测精度很高

  2. CCD传感器的成本要比TOF的雪崩光电二极管(APD)、硅光电倍增管(SiPM)要低很多,是最便宜的激光测距方案。

但其缺点也很明显:

鉴于其特点,三角测距在室内近距离测距 场景下比较常用,比如扫地机器人。在自动驾驶领域基本被弃用。

3.2.4 AMCW测距:相位测量(iToF)

AMCW即连续波强度调制(Amplitude modulated continuous wawe)。通过调整激光器的输入功率(电流),调整发射光强度,从而对发射激光的振幅进行周期性的调制。通过求解发射波与接受波之间的相位差来反推ToF,因此这种方案也被称为iToF(indirect ToF)。注意:该"相位"指的是周期性调整激光振幅的相位,也就是控制激光的交变电流的相位,而非激光本身的相位。

AMCW测距法

由于测量振幅相位比直接测量ToF更加容易,AMCW测距方式精度更高,主流的激光测距仪,其原理就是AMCW测距。显然,根据傅里叶变换原理,对激光振幅相位的采集需要一定的采样时间,其测距速度相较ToF会慢一个数量级。若用机械扫描的方式,其帧率会极慢。

恰好,AMCW测距比较方便实现固态**Flash LiDAR,(为什么适合后面会讲到)。**但问题又来了,AMCW由于发射连续光波。其功率很大,对人眼存在很大的安全隐患,较难通过车规认证。

其实,深度相机同样广泛采用AMCW测距,其将近红外(NIR)频谱中的调制光投射到场景中,并记录光线的返回时间,生成一组深度图。

3.2.5 FMCW测距法

厂商:AevaMobileye & Intel、Blackmore、光勺、洛微等

激光FMCW的测距原理同第二章FMCW Radar的测距原理完全相同,在此不做叙述。

其优点在于:

  1. FMCW的精度可以达到毫米级

  2. 利用多普勒效应可以解算目标的速度信息

  3. FMCW信噪比极高,具有极强的抗干扰能力

  4. 平均功率很小(比现行ToF更小),对人眼安全

  5. 探测距离远,可达600m;

  6. 易与光学相控阵OPA结合,实现纯固态激光雷达(后面会叙述)

其缺点在于:

  1. 对激光的线性调频、光学混频技术比毫米波困难许多,即便研发完成,也是成本最高的方案

  2. FMCW的单次测距需要20us,点云形成速率为:50000point/ s,**点云密度先天不足(方案硬伤)。**相比之下,TOF仅需要不到2us即可完成测量。

3.2.6 测距方案的讨论

汇总四种测距方法的特性,结果很明显,**当前能通过市场考验的也只有TOF。**三角测距、FMCW都存在硬伤,未来很难有大的发展。**而FMCW具有很大的潜力,**是当前的业界的研究热点。

方法 成本 速度 量程 寿命 安全 精度 体积 备注
TOF ✔中 ✔最快 ✔较大 ✔中等 当前主流方案
三角 ✔最低 ✔最快 ❌最小 ❌差 远处精度太差
AMCW ✔较低 ❌较慢 ✔较大 ✔高 很难满足安全
FMCW ❌最高 ❌较慢 ✔最大 ✔最好 ✔高 未来方向之一

Ref:
相干探测_百度百科 (baidu.com)激光接收系统_百度百科 (baidu.com)光学混频_百度百科 (baidu.com)

3.3 激光雷达的扫描形式

测距方案都是针对单点的检测,只有配合扫描方法 ,才能实现大视角范围内的探测。LiDAR的扫描形式可以分为机械,混合固态,纯固态三种。其中:

  1. **机械:**由机械旋转机构驱动激光收发器件进行旋转,从而完成对FOV的测量;

  2. **混合固态:**激光收发器件静止,通过转镜、棱镜、MEMS振镜的运动改变激光反射角度,完成对FOV扫描;

  3. **纯固态:**利用相控阵技术使激光发射方向改变完成扫描,或利用Flash技术直接探测;

再次提醒:扫描方式测距方法 完全是两种分类依据,不能混为一谈。下面也会给出每种扫描形式可配合使用的测距方法。

3.3.1 机械扫描:一维转台

**常用测距方法:**TOF

**代表厂商:**Velodyne、Ouster、Waymo、禾赛、速腾聚创、镭神智能、北科天绘

以Velodyne 64线激光雷达为例,其将64个激光器垂直堆叠在一起。然后使其连续旋转,完成360°的环境测量。旋转机构 在机械学上可称为:"转台"

Velodyne机械式激光雷达

优点 1. 转速稳定,扫描线性,视角360°; 2. 当前所有Lidar中,精度最高、点云最稠密(128线,双回波可达691万点/秒);
缺点 1. 包含多套收发模块,成本极高;动辄数十万; 机械转台需要满足:较小的重量、体积、极高的角精度、可承受20Hz的高速旋转。这对于机械设计和加工、伺服电机的运动控制都有着极大的挑战。这导致了: 2. 体积大,重量大,可靠性差,平均失效时间只有1000-3000小时,需要频繁的维护保养,难以达到车规级最低13000小时的要求。 3. 内含较多可动部件,在行车环境下磨损严重、需要大量人工组装调教,规模化量产困难

因此,在自动驾驶研发、高精地图建图的过程中,对成本不敏感的采集车还是会采用性能最高的传统机械式雷达,但将其落地到量产车型就完全不现实。随着其他种类雷达的性能提升,该种雷达会逐渐式微。

3.3.2 半固态1:转镜式

**常用测距方法:**TOF

**供应商:**华为、速腾聚创、Luminar、大疆Livox、禾赛(几乎所有厂商都有)

该种激光雷达的激光器固定不动,利用一面可以转动的镜子反射激光,从而实现在空间的扫描。其极大的缩小了机械式的体积。转镜的控制灵活度也要比伺服转台高很多。转镜又可以分为一维转镜、二维转镜、多面转镜、以及双棱镜等多种细分路线

3.3.2.1 一维转镜

顾名思义,一维转镜只能在一个维度实现旋转,如果需要实现面扫描就需要并排放置多个激光器,这和纯机械式雷达有点像。不过,车规级转镜雷达要实现较小的体积,则需要芯片化的VCSEL激光器。

案例:2022.06.21上市的理想L9 搭载的禾赛AT128就是一维转镜雷达(这应该也是截至2022的第一款量产一维转镜雷达)。其VSCEL激光器也是苹果同家供应商Lumentum 生产。禾赛采用了三镜面的方案,200rpm的低转速即可实现10Hz的扫描速度。其153万/秒的点频也是当前最强的半固态雷达。

理想L9

禾赛AT128一维转镜激光雷达

优点 1. 旋转自由度少,控制更简单,系统的精度、刚性更好;
缺点 1. 多个激光器硬件成本更高,制造良品率低,且只有905nm的硅激光器能在芯片上实现VCSEL工艺,而磷化铟1550nm激光器目前无法实现; 2. 受限于功率,VCSEL探测距离相对受限;

3.3.2.2 二维转镜

对应的,二维转镜可以利用一个激光器就完成对FOV的扫描:

优点 1. 这样做自然成本会低不少, 2. 控制灵活,可以对ROI进行增稠扫描; 3. 单激光头可以用光纤激光器,比VSCEL功率大,可探测距离远;
缺点 1. 2维转镜复杂度高,刚性相对差,控制麻烦; 2. 出点数量极限比较低;

3.3.2.3 Livox双棱镜

大疆Livox的方案比较与众不同,其采用了激光通信领域的旋转双棱镜方案。电机带动双棱镜高速旋转。激光在通过第一个楔形棱镜后发生第一次偏转,通过第二个楔形棱镜后发生第二次偏转,控制两面棱镜的相对转速便可以控制激光的扫描形态。产生不同角度的折射光线,从而实现对FOV的扫描。

Livox的棱镜方案 与 点云排布样式

优点 1. 和上述二维转镜差不多;
缺点 1. 点云中心稠密,边缘稀疏; 2. 每次扫描成像的范围不一样,车辆高速移动中成像不连续; 3. 原理导致电机转速过高,6000rpm,影响寿命。 也因此,此款Lidar市场化情况不理想,只有小鹏P5安装了一些,Livox应该也在开发新的方案
  • 2022市场化情况(目前可能有点过时,凑合看吧)

2021-2022年,是转镜式半固态激光雷达的大年,将会有大批车型搭载上市,这也是激光雷达的首次大规模的商用化落地。可预测,这会给汽车的辅助驾驶功能带来极大的提升。

华为 Luminar-Iris Livox-HAP 市场反馈不好 Innovusion-Falcon 禾赛AT128 2022最强转镜雷达
激光光源 905nm 1550nm 905nm 1550nm 905nm
扫描方式 转镜 双轴转镜 双棱镜(特殊) 双轴转镜 单轴转镜
激光器数量 6 8 128VCSEL激光器
探测距离 150m@10%NIST 250m@10%NIST 150m@10%NIST 250m@10%NIST 200m@10%NIST
精度 cm 2cm
视场角 120°x25° 120°x30° 120°x25° 120°x25° 120°x25.4°
角分辨率VH 0.25°x0.26° 0.06°x0.06° 0.18°x0.23° 0.05°x0.05° 0.1°x0.2°
帧率 20Hz 10Hz
线数 等效96线 等效300线 等效144线 等效300线 真128
出点数/s 45万 80-100万 153万
价格 $1000(10万台)
搭载车型 极狐阿尔法 R汽车ES33 小鹏P5 蔚来ET7 理想L9、集度、高合

2021-2022转镜激光雷达量产项目

Ref:
AT128 - 禾赛科技 (hesaitech.com)解读理想L9激光雷达,真·128线是怎么来的?【电动课堂28】_哔哩哔哩_bilibili

3.3.3 半固态2:MEMS

MEMS激光雷达是近年可以落地的第二个方案。其方案核心是:利用MEMS(Micro-Electro-Mechanical System)技术,将**"微振镜"、与传感控制电路**集成在一个硅半导体芯片上。极大的缩小体积与成本。

MEMS LiDAR的微振镜

  • 扫描机构地柔性形变

似乎芯片上并没有旋转机构,这个反射镜是如何旋转的?实际上,转镜边缘细细的连接悬臂就是实现旋转的机构,在机械学上被称为:柔性铰链(Flexible Joint)。利用材料的弹性形变,能够在比较小的范围内输出非常精密的位移、旋转。同时还可以对驱动源的运动进行偏转、放大

相比传统的机械结构,其优点是:响应速度极快、分辨率极高 ,可轻松输出纳米级分辨率的运动。

机械学概念:柔性铰链

但这种扫描机构需要克服的缺点有以下几个:

  1. 其运动输出有较强的非线性;

  2. 存在耦合运动(比如X轴的位移,会引起Y轴的位移);

  3. 可实现的偏转角度有限,形变过度则不可回复;

  4. 微机械结构过分脆弱,在恶劣工况下寿命有限;

所谓**"振镜",**意味着其工作在谐振频率下,这时候还需要注意其输入功率不能过大,否则会因谐振而对器件产生损伤。

  • 精密驱动技术

如此精密的机械结构,如何驱动?显然传统的伺服电机是不可能的,需要采用微驱动方法:比如**静电驱动(ES),电磁驱动(EM),电热驱动(ET)以及压电驱动(PE)**四种。

以笔者熟悉的**压电陶瓷(Piezoelectric Ceramics, PZT)**为例:回想一下打火机,大拇指按下去就有电流打出,这就是所谓"压电效应";反之,给压电陶瓷两端通电之后,也会产生一个位移。这个位移的总行程不过几百微米,而分辨率则可以达到纳米级。

而压电驱动器同样存在令人恼火的**非线性。以压电陶瓷为例,其运动输出不会随电压升高而线性变化。而是具有 "迟滞""蠕变"**的特性。"迟滞"的意思是:其升压曲线和降压曲线存在明显差异,甚至电压变化速率不同时候,升压曲线还会不一样。而"蠕变"的意思是,压电陶瓷的位移还会随着时间的变化而缓慢变化,即使其两端电压并没有改变。另外,外界温度、湿度、磁场、机械振动都会改变其输出特性。

压电陶瓷的迟滞、蠕变特性

  • 需求:精密闭环控制

除了PZT之外,**其他的微驱动方式的输出非线性问题也比较严重。**到微观层面,机械系统的漂移 也成为一个影响运动精度的重要因素。所谓"漂移",指的是物体会随着时间推移产生微米级的运动漂移。这在宏观的机械系统上不算什么,但在微机电系统则是必须要消除的因素。

如此一来,微动系统需要 "高实时性" "高精度" 的精密闭环控制,对于当前的技术手段倒也不难实现。因此,MEMS LiDAR的商用被推上日程。

  • 优缺点

优点将反射激光地"镜子"也集成在了芯片中,摆脱了宏的精密闭环控制,对于当前的技术手段不难实现。因此,MEMS LiDAR的商用被推上日程。射面积也大(接收功率大),其可测量的范围也就越远,但相应的微振镜的旋转角度范围越小,视场角很受限;

优点 将反射激光地"镜子"也集成在了芯片中,摆脱了宏观的机械运动装置,极大缩减了量产成本; 减小了硬件体积;
缺点 微振镜的尺寸越大,其反射面积也大(接收功率大),其可测量的范围也就越远,但相应的微振镜的旋转角度范围越小,视场角很受限; 如果减小振镜尺寸,其转角范围大,视场角增大,但其反射面积变小,可测量范围不足; 振镜受外界温度、振动环境影响会导致谐振频率的变化,从而导致线束紊乱、成像歪曲; 硅基的MEMS柔性悬臂极其脆弱,其机械强度、抗老化性能都比较一般,影响到MEMS Lidar的寿命,总体鲁棒性不如转镜方案(2022Q2结论)。
优点 将反射激光地"镜子"也集成在了芯片中,摆脱了宏观的机械运动装置,极大缩减了量产成本; 减小了硬件体积;
缺点 微振镜的尺寸越大,其反射面积也大(接收功率大),其可测量的范围也就越远,但相应的微振镜的旋转角度范围越小,视场角很受限; 如果减小振镜尺寸,其转角范围大,视场角增大,但其反射面积变小,可测量范围不足; 振镜受外界温度、振动环境影响会导致谐振频率的变化,从而导致线束紊乱、成像歪曲; 硅基的MEMS柔性悬臂极其脆弱,其机械强度、抗老化性能都比较一般,影响到MEMS Lidar的寿命,总体鲁棒性不如转镜方案(2022Q2结论)。
优点 将反射激光地"镜子"也集成在了芯片中,摆脱了宏观的机械运动装置,极大缩减了量产成本; 减小了硬件体积;
缺点 微振镜的尺寸越大,其反射面积也大(接收功率大),其可测量的范围也就越远,但相应的微振镜的旋转角度范围越小,视场角很受限; 如果减小振镜尺寸,其转角范围大,视场角增大,但其反射面积变小,可测量范围不足; 振镜受外界温度、振动环境影响会导致谐振频率的变化,从而导致线束紊乱、成像歪曲; 硅基的MEMS柔性悬臂极其脆弱,其机械强度、抗老化性能都比较一般,影响到MEMS Lidar的寿命,总体鲁棒性不如转镜方案(2022Q2结论)。
优点 将反射激光地"镜子"也集成在了芯片中,摆脱了宏观的机械运动装置,极大缩减了量产成本; 减小了硬件体积;
缺点 微振镜的尺寸越大,其反射面积也大(接收功率大),其可测量的范围也就越远,但相应的微振镜的旋转角度范围越小,视场角很受限; 如果减小振镜尺寸,其转角范围大,视场角增大,但其反射面积变小,可测量范围不足; 振镜受外界温度、振动环境影响会导致谐振频率的变化,从而导致线束紊乱、成像歪曲; 硅基的MEMS柔性悬臂极其脆弱,其机械强度、抗老化性能都比较一般,影响到MEMS Lidar的寿命,总体鲁棒性不如转镜方案(2022Q2结论)。
优点 1. 将反射激光地"镜子"也集成在了芯片中,摆脱了宏观的机械运动装置,极大缩减了量产成本; 2. 减小了硬件体积;
缺点 1. 微振镜的尺寸越大,其反射面积也大(接收功率大),其可测量的范围也就越远,但相应的微振镜的旋转角度范围越小,视场角很受限; 2. 如果减小振镜尺寸,其转角范围大,视场角增大,但其反射面积变小,可测量范围不足; 3. 振镜受外界温度、振动环境影响会导致谐振频率的变化,从而导致线束紊乱、成像歪曲; 4. 硅基MEMS柔性悬臂极其脆弱,其机械强度、抗老化性能都比较一般,影响到MEMS Lidar的寿命,理论上总体鲁棒性不如转镜方案(2022Q2结论)。
  • MEMS激光雷达量产项目案例(2022.06)

当前(2022年Q2)情况,MEMS激光雷达处于量产前夕,主要是速腾聚创的M1激光雷达,已经拿下多家OEM的采购定点。其性能参数与转镜雷达差不多。(小鹏也投资了速腾聚创)

速腾聚创-M1 一径科技ML-30S 中距 一径科技ML-30S 长距 Innoviz One Innoviz Two
价格 OEM报价4K-5K
激光光源 905nm 1550nm 1550 905nm 905nm
激光器数量 5个
探测距离 150m@10%NIST 250m@10%NIST 300m@10%NIST
精度 5cm(1σ)
视场角 120°x25° 140°x70° 115°*25° 125°*40°
角分辨率 0.2°x0.2° 0.5° 0.1° 0.1° * 0.1° 0.07° * 0.05°
帧率 10-20Hz 5-20
分辨率 等效125线(600x 125) 等效160线
出点数 75万/s
价格 1898,大规模500
搭载车型 小鹏G9 上汽、广汽、 北汽、威马、Lutos 无OEM定点 元戎robotaxi 无OEM定点 元戎robotaxi 宝马inext 研发中
  • 等效线数的解释:

"等效XXX线"是常见于MEMS激光雷达二维转镜激光雷达 的一种宣传。比如我们会看到"等效300线"的宣传,这会给人一种:"比几十万的128线机械雷达线数更多" 的感觉。实际上这种说法是厂家耍的一点小聪明。

MEMS激光雷达和二维转镜激光雷达往往只有一个或者几个激光器,然后搭配二维扫描机构实现对FOV的扫描,这就相当于 "用XXX线的机械式/ 一维转镜式激光雷达扫描出来的效果一样"。

但是,受限于转镜或MEMS振镜的工作频率------实际上,目前(2022.Q2)MEMS和二维转镜式整体的点云密度/出点速度,仍然是不如高指标的传统机械雷达以及一维转镜雷达的。例如,禾赛Pandars128机械雷达在单回波模式下每秒出点345万,禾赛AT128一维转镜雷达单回波每秒出点153万。而二维转镜和MEMS的LiDAR,出点速度过百万的产品也不多。

Ref:
官网:
速腾聚创 - RoboSense(速腾聚创) - 自动驾驶激光雷达(M1 MEMS激光雷达)
北京一径科技_固态MEMS激光雷达 (zvision.xyz)新闻:
路特斯ELETRE首发 凭借速腾聚创RS-LiDAR-M1激光雷达实现全面感知 (baidu.com)

3.3.4 固态激光雷达1:光学相控阵OPA------类似雷达的原理

配合测距方法:TOF,FMCW(更合适)

**代表厂商:Quanergy(已倒闭),**截至2022Q2,国内厂商基本都处于预研阶段。包括力策科技,洛微科技,万集科技、国科光芯、速腾(有布局)、镭神(有布局),整体产业发展是比较缓慢。

光学相控阵(Optical Phased Array)的实现原理和毫米波相控阵的实现原理一样,都是利用波的相干性改变波的方向,不再重复叙述。其存在一些工程上的难点:

  1. 根据相控阵原理,要求激光的阵列单元尺寸约等于半波长,这意味着发射单元的尺寸在数百纳米,对硅光芯片的加工会比较困难。

  2. Quanergy 采用OPA+ToF 的方案,ToF方案的瞬时功率太高,可达40-50W,硅光芯片根本扛不住如此高的功率。而降低功率又使得探测距离不足,当前只能支撑100m左右的探测。

  3. 同样的,在相控阵Radar研发中出现的难题,如:旁瓣效应、易受环境光干扰、信号处理算法复杂也会出现在OPA LiDAR上。

Quanergy 光学相控阵Lidar

  • OPA+FMCW:4D激光雷达

代表厂商:Mobileye(CES亮相)、洛微、Aeva

前面提到了激光FMCW测距,而恰恰连续调频波的瞬时功率很低,可以完美的配合OPA实现空间的扫描,实现所谓的4D激光雷达,是固态激光雷达的一个相对热门的方向。

Mobileye 4D成像雷达:拥有更广泛独特动态范围的超高分辨率雷达,可提供丰富而准确的场景图像_哔哩哔哩_bilibili

3.3.5 固态激光雷达2:Flash------类似相机的原理

核心器件:VCSEL + SPAD

代表厂商:禾赛、速腾聚创等(基本都在搞)

**可配合测距方法:**ToF,AMCW

  • 测距原理

**如何形象的去理解Flash激光雷达的原理?**想象你处在一个黑暗的环境下,手里举着一台照相机。当你想要拍摄照片时,相机的闪光灯打开,照亮了环境,当曝光结束后,闪光灯随之熄灭,环境再次归于黑暗------这是一种可见光的Flash(闪耀)。

而Flash LiDAR的原理类似,在其对应的905nm或1550nm波段,待探测的环境可以视为是一片黑暗(环境中的此波段红外线并不多),而Flash LiDAR配备了阵列式的发射光源以及接收部件,短时间直接发射出一大片覆盖探测区域的激光,再以高度灵敏的接收器(SPAD,单光子雪崩二极管增益极高),来完成对环境周围图像的绘制,最终生成的数据包含了深度等3D数据。

现在来解释为什么其更加适合AMCW的测距方式,**AMCW本质上是通过测量反射激光的强度来确定距离的,**自然地,对于CMOS工艺的芯片,这种测量是很容易实现的。不过其最大的弊端就在于忽略了"不同目标有着不同的激光反射率"这一因素,使得测量准确性大打折扣,**属于先天硬伤。**当然,Flash LiDAR用TOF也不是不行,这意味着对于每一个"Pixel",都需要单独的一套计时的电路。

由于结构简单,集成度极高,Flash闪光激光雷达是目前纯固态激光雷达一种主流的技术研究方向。实际上,所谓的Flash Lidar也是深度相机方案的一种**。**

LeddarCore flash LiDAR

Flash LiDAR工作原理(左:结构光模式)

从其工作原理,我们完全不难推断其最大的难点:Flash LiDAR相当于一台将照相机将闪光灯、感光元件都集成在了一块芯片上 。要想看得清楚,这个"闪光灯"的功率就必须足够大,如果采用AMCW测距,这个"闪光"的时间还需要长一些------显然,一般的芯片根本扛不住这种功率。

因此,当前缺点是:

  1. VCSEL器件可输出的功率密度低,导致其有效距离一般难以超过50米,一般作为补盲雷达使用

  2. 当前可实现的车规级SPAD阵列约为1W像素(民用已有30W像素),致使其分辨率较低。

今后如何增加VCSEL输出功率,增大SPAD阵列密度,将会是Flash LiDAR需要解决的难题。

  • 车规级的市场化
  1. 搭载3个Ibeo Next固态激光雷达的长城WEY摩卡车型预计在2022年量产;

  2. Ouster ES2选择牺牲扫描角度(26°×12°)换取较远的探测距离(200m),预计2024年实现批量交付。

  3. 2022年11月,禾赛FT120 Flash激光雷大发布,主要用作车角补盲雷达;

  4. 速腾聚创紧随其后,在11月7日的Tech Day上,发布了自家的 纯固态 激光雷达产品E1;

真·纯固态激光雷达?禾赛 FT120 有点东西_哔哩哔哩_bilibili速腾聚创首款全固态补盲激光雷达E1系列首次公开亮相|CES现场_哔哩哔哩_bilibili

3.3.6 激光雷达方案汇总

当下,转镜式和MEMS会落地,而长期来看,其只是过渡方案,固态的激光雷达肯定是一个发展的大趋势。

固态的方案中,OPA+FMCW以及Flash是两个有希望的方案。而学界和业界更为认可、更能吸引到投资的则是后者。极快的速度、极高的集成度、很低的成本、如今天的照相机一般易得,这都是人们对于Flash LiDAR的愿景。

但也必须客观看待激光雷达的发展,固态激光雷达都有着十分难以逾越的障碍,车规级硬件的研发又会面临较为严苛的工作环境以及测试。其开发周期必定是以年计,很多投资科普类的文章会热衷于将雷达的种类罗列一番,但完全没有阐明其主要技术障碍,因此任何大跃进的思想在这块都是行不通的。

成本 体积 测量速度 精度 安全性 工作寿命 量程 备注
机械式 ❌万美元 ✔快 ❌3000h ✔300m 未来逐步淘汰
转镜式 ✔数百美元 ✔中等 ✔中 当前的落地方案
MEMS ✔数百美元 ✔快 ✔中 热点落地方案
OPA ❌高 ✔中 ✔最远 FMCW+OPA有前景
FLASH ✔远景最低 ✔极快 ❌当前不足 ❌当前小 前景较大

疑问:

A. TOF的精确计时原理,TDC电路如何做到ps级别的计时?

B. 激光雷达的寻峰算法是什么?

D. LIDAR输出的信息编码格式是怎样的?后续应了解TCL、ROSMSG点云格式

3.4 Backups 激光雷达厂商概况

一些激光雷达的宏观市场信息,来源于厂商网站与券商研报,可保证2022年有效,这种东西不搞投资看一眼就行,没太多意义。中国市场太卷,情况每个季度都在快速变化。

各车企2021-2022年搭载激光雷达车型

4. 相机 Camera

相机话题比较大,本文简单介绍下,后面单独发个文章介绍camera原理

4.1 相机的特殊性

同其他传感器相比,相机是一个非常独特的传感器。其独特性体现在三个方面:

4.1.1 有源与无源

前面提到的雷达都可以视为有源 传感器,即自发自收电磁波信号,完成感知。而大部分的相机则可理解为一种无源传感器(不包括深度相机,主动式红外相机 )。其自身并不发出信号,而是依靠CCD/ CMOS 感知周围环境物体发出的可见光。光源则可以来源于太阳、电灯、屏幕等(闪光灯也可视作外部光源),经过物体散射进入相机传感器。这一特性决定了普通相机在缺少外部光源的环境下(弱光环境)工作十分受限,如同人眼在昏暗环境下感知能力大幅下降一般。

自发自收的Radar/Lidar则不受此类影响,相反地,雷达还需要尽力摒除环境中同频率的杂波干扰。

4.1.2 强度的感知

Camera另一个重要的特性是,十分强调对 "可见光强度intensity"(电磁波能量大小 or 振幅)的敏感性,根据单位时间接收到可见光能量的大小,将其转化为不同的灰度值 (如0-255)。而对灰阶的重视使得相机具有丰富的纹理信息,最终这些纹理转化为了所谓的**"语义"**。

当然,并不是说,其他传感器没有对 "强度intensity" 的感知,例如激光雷达就可依据车道线与环境对红外线反射率的不同,达成对车道线的识别;金属也对毫米波具有极强的反射性。但总体而言,其他传感器的侧重点更多放在了 "有 or 没有",对强度的感知没那么侧重。

相机对于"强度"良好感知来源于光电二极管良好的线性输出(式25 ),其积累电荷与输入能量成正比。

对"强度/ 振幅"的感知形成黑白图像,多个电磁波频率的感知形成彩色图像

4.1.3 单频率与多频率

如果仅凭感知强度的话,相机只能形成黑白图像,其语义信息仍然不够丰富。通过模仿人类的三种视锥细胞,相机配备了三种传感器,分别感知:**615620nm的红光,530-540nm的绿光,460470nm的蓝光,**进而由接收的三原色的比例来合成彩色图像,赋予图像更为丰富的颜色信息。

**相机是唯一同时接收多个频率的电磁波,并将多种电磁波进行融合的传感器。**而其他大多传感器只能接受单一频率的电磁波。

CMOS感知RGB光源

"强度感知""多频率感知" 给使相机具有以下特点:

  1. 远超其他传感器的感知能力、信息密度

  2. 信息相比Radar,LiDAR十分隐含、抽象,需要更高级别的智慧来对图像做出解读。

  3. 意味着算法可挖掘的潜力巨大,但对算力的要求也更高。

4.2 物体的显色原理

岔开话题,提一嘴物体的显色原理。

4.2.1 主观的颜色

**"特定的波长的光呈现某种特定颜色" 这一定义是十分主观的,例如"波长570nm的光呈现黄色"。这是在人类进化过程中视觉细胞与大脑约定俗成的。**甚至,在不同生物之间,其色觉感知存在很大的差异。人类理解世界所采用的这一套色觉体系,很大程度上仅适用于我们人类,例如狗就没有感知红色和绿色的视锥细胞,而一些鸟类对颜色的感知要比人类更加丰富。

模拟差异:鸟类色觉与人类色觉

4.2.2 电磁波的吸收与反射

物体(分子、原子)都具备吸收和反射电磁波的能力,而且不同物体对不同波长的电磁波也有所偏好。例如水对微波的吸收能力极强(微波炉 ),纯银(铝)对所有可见光的反射性极强(镜子 );当然还有的物体对电磁波不吸收也不反射(玻璃)。

以红色物体为例,其对于波长650nm左右的红光的反射性最强,而会吸收其他颜色的可见光。于是,它在人眼中就会呈现红色。

物体的显色

而被吸收后的光子则有以下去向:

1、被电子吸收,微观上转化为电子的动能,宏观上表征为物体内能增加,温度升高。(颜色越深,吸收可见光越多,温度越高,理想的黑体不反射、投射任何电磁波)

2、如果电子所得能量很高,可以脱离导体表面形成光电流,那么其定向移动表征为电磁能(光电效应)

3、若电子能量再高一些,其动能足以同其他电子发生碰撞,摆脱原子束缚,进而破坏分子结构,则会表征为化学能(光合作用)。

4、表征为质量。

4.2.3 电磁波的向外辐射:红外夜视仪

除了吸收、反射电磁波,物体还可以发射出电磁波 。任何温度高于绝对零度(-273.15℃)的物体都具有内能,表征为分子原子的无规则运动。而内能则会以电磁波辐射的形式发散出来,其内能越高,辐射的波长也越短 (加热到几百度,就可以发出可见光)。地球环境温度下,辐射的电磁波频率恰好处在红外线波段。

而能够捕捉物体放射出的红外线的仪器 ,也就是红外热像仪(夜视相机)

夜视相机有主动式被动式两种,被动式利用了物体本身的自发辐射;主动式则会发出红外线,并接收反射信号,其实可以理解为开了相机"闪光灯",只不过这个"闪光灯"发出的是红外线,人眼看不见。

同普通相机一样,红外成像同样具有抽象的纹理信息。因此,在自动驾驶的传感层也会有一定的潜力。

红外成像

此外,军事上还会用到微光夜视技术,不做讨论。

4.3 感光器件

  • CCD与CMOS工作模式

本节基本没意义,可以直接跳过。CMOS工艺进步较快,在民用上占绝对优势。性能和价钱成正比。

CCD(Charge Coupled Device 电荷耦合器件):

结束曝光后,控制电路会将 CCD 每一列中的每个电容把自己的电荷传给相邻的下一个像素的电容,最后经过传感器末端的一个电荷放大器,转化为电压信号。

CMOS(Complementary Metal-Oxide Semiconductor) 互补式金属氧化物半导体(硅锗):

每个像素的光电二极管都会连接一个放大器和 ADC 电路,读出该像素的值。

CCD与CMOS的区别

根据CCD和CMOS的工艺差异,可以得出以下优缺点(当前CMOS工艺发展较快)

CCD CMOS
成本 链式传递,良品率低,成本较高 CMOS独立,周边电路的成本较低
开口率 低(堆栈式CMOS开口率高)
动态范围
快门 天然的全局快门,无"果冻效应" CMOS则按列报数,为卷帘快门。
噪声 所有的电荷经过的是一个电荷转换器,因此转换的一致性比较好,噪声小。 但可能产生电荷溢出(Blooming)Fading(电荷衰减)。 抗干扰性比较强,但每一个电路比较难保持一致性。
读取 CCD为逐个读取,速度慢 CMOS则要快
能耗 CCD为被动式读取,需要外接12V/18V电源 能耗约为CCD的1/10

Ref:
CCD CMOS传感器基本工作原理

  • 感知单元:微透镜阵列

前照式与背照式

感光芯片的最小单元由:微透镜、滤光器、光电二极管、金属连线层 组成**。**其布置形式有前照式与背照式两种。微透镜用于汇聚光线,滤光器只允许目标波长的光透过,而其他波长的光则不会透过,光电二极管将光信号转化为电信号,其强度与光强度成正比。

对颜色的感知:利用滤光系统,1R,2G,1B。Bayer滤镜。

Bayer Filter

4.4 ISP 图像信号处理

ISP(Image Signal Processing) 图像信号处理。将CMOS、CCD发出的电信号处理为可视化的图像。不想写,和主题相关性不大,网上资料也多。。

参考资料
光电探测器PMT、APD、CCD、CMos、ICCD、EMCCD等各自的优势和劣势? - 知乎 (zhihu.com)从微观的角度来看,光能是如何转化成其他形式的能量的? - 知乎 (zhihu.com)Thermographic camera - WikipediaCCD(电荷耦合元件)_百度百科 (baidu.com)CMOS_百度百科 (baidu.com)键盘摄影(五)------相机成像元件:CMOS/CCD - 知乎 (zhihu.com)黑体辐射理论_百度百科 (baidu.com)普朗克长度_百度百科 (baidu.com)

5. 机械波与超声雷达 Ultrasonic Radar

5.1 超声雷达的原理与局限

再来看一下超声雷达,超声雷达已经是相当成熟廉价的产品,十多年前的汽车基本都配备了超声雷达用于倒车辅助。我们观察到的前后保险杠上的一个个小圆圈,就是超声雷达。

Audi A8的前向超声雷达

与前面的传感器不同的是,超声雷达采用的是机械波(声波)来传递信号。超声波的发射原理很简单:无非就是将一定频率的电流通过换能器转化为一定频率的机械振动(一般为20Khz-100Khz),换能器一般多采用压电陶瓷,当工作在谐振频率时,可达到最佳效果。

超声雷达的发射器件没什么挑战性,至于接收原理更简单,就是发射原理的逆效果,这里不再赘述。

车用超声雷达有着很大的局限性:

特性一:温度敏感

声速与空气的温度相关:C = C0 + 0.607 * T,C0为0°时的声波速度332m/s,那30℃时,超声波的传播速度为350m/s。因此还需要将环境温度纳入到传感系统中。

特性二:无法精确描述障碍物位置

车用超声雷达只能给定障碍物的距离,但无法确定障碍方位。此外,超声波散射角大,方向性差,测量远距离物体精度很差。

**当然,其实就是受制于体积成本不想做而已,**实际上利用前面提到的MIMO Radar原理,实现超声测角并不难,只不过分辨率也不会很高。

特性三:高速场景的实时性差(硬伤)

声速比光速慢的太多,如需检测100m处的物体,其时间延迟为0.2m,当汽车以120km/h高速行驶时,则汽车已经走出20m,超声雷达很难跟得上汽车的实时变化。

随便提一句,超声雷达的优点是在适合水下探测。因为电磁波在水下衰减速度非常快(无线电只能用长波雷达联系潜艇,且通信速度极慢,天线尺寸巨大,公里级别)。而超声波在水下衰减慢,因此船只一般都用"声纳"探测海底环境。

5.2 防止"灯下黑"

具备如此多的缺陷,但并不意味着超声雷达在自动驾驶中没有用武之地。LiDAR,Camera,Radar一般用来检测5m开外的目标。**而汽车半径5m内的空间则是其"盲区",正是所谓的"灯下黑"。而超声雷达是当前检测近处物体最为高效、省钱的方案。在泊车、行人"鬼探头"**场景下,超声雷达发挥着重要的作用。当然,现在以tesla为代表的厂商开始舍弃超声雷达,而是用视觉包揽。

行人"鬼探头"场景

另一较为有趣的应用场景是"高速场景的横向辅助",尽管这个案例很古老了,在Tesla的Autopilot 1.0版本中,当后面的一辆车对己方进行超出的时候。车辆可以在车道内进行轨迹微调,在允许的一定范围内对进行避让,从而提升安全性。

6. GNSS-RTK全球定位

GNSS技术应该算作是**"定位技术"**,其具体的实现方式不谈,后面如要系统性的总结定位方法再写。目前讨论其"电磁波信息传输"的属性。

GNSS是全球导航卫星系统的简称(Global Navigation Satellite System)。GPS的根本原理还是电磁波通信,只不过是空基的。

GNSS定位技术:空基电磁波通信

各国的GNSS信号频率在1.5GHz 附近,可推算波长0.2m左右。那么同样可以轻易得出一些结论:

  1. GNSS的波长特性使其信号传输受浓厚云层、大雾、雨雪的影响不大。

  2. 信号在空旷地带效果最佳,**城市的高楼大厦,山区的山体都会阻挡、反射信号,**极大影响信号传输。

同时,因为其电磁波的本质,GNSS信号不可避免的会受到大气层中电离层、对流层的折射,从而产生误差。这也是GPS信号误差的一个很重要的来源。当然,可以通过PPP,RTK等差分技术消除。

再说用来消除GPS误差的RTK(Real time Kinematics)系统,它的信号的频率在410-470MHz之间,其波长为0.7m左右。同样的,这个波长可以使RTK信号免受天气的影响,但在城市、山区、隧道的工况下仍然面临很大的问题。这其实就是GNSS-RTK无法在100%工况适用的根本原因,很难有 "出现一种新技术,使得GNSS-RTK能够覆盖100%场景" 的情况发生。

参考资料:
Satellite navigation - Wikipedia

7. 无线通信与V2X

许多汽车行业企业的愿景是:未来将汽车打造为一种**"智能终端"**,汽车将拥有接入互联网能力,与道路、其他车辆、行人产生信息交互,即所谓的V2X(Vehichle to Everything)。

2021年11月16日,工信部发布了《"十四五"信息通信行业发展规划》,规划指出将在2025年完成相当规模的c-V2X基础建设。V2X技术可以为自动驾驶、人机交互提供支持,而这一切又跟另一个火热的概念"5G"扯上了联系,而5G说到底又是对电磁波的应用。

V2X设想图

7.1 无线通信的简要原理

前面提到的传感方式,更多将注意力放在了电磁波的频率、相位、方向上,而无线通信则更关注**"波形"**的调制。利用电磁波的高、低振幅表示数字信号 0 或 1,从而完成数字信号的传输过程,当然,现实的技术细节远比此过程复杂。

常用基带波形

5G相对于4G的一个重要优势是其时间延迟极短。一般4G的无线链路延迟最少要20-30ms ,而理想情况下5G可以做到1ms 左右,低延迟的信号传输 可以满足自动驾驶系统的低实时性需求。当然,副作用前面也提到了,代价就是需要进行基站的超密组网,这是一比相当昂贵的基础建设费用。

7.2 定位潜力

如果能实现5G的超密组网,能够带来另一项副产品:高精定位。其定位的原理同GNSS基本一致。当前5G的定位精度潜力在1m左右,在城市环境下作为一种辅助定位手段,具备不错的潜力。

不同定位方式的精度,By TUM,2020

8. 单传感器 vs 多传感器

感知-定位-决策-执行四层,感知是基础。如何提升感知能力,一直是众多自动驾驶参与者的目标之一。

具体的做法无非两种 :一是拓宽感知 ,采用多个传感器接受更多的信息,其二则是加深感知,通过深度学习提升系统的智慧程度,使其靠近人类大脑的处理能力。绝大部分公司两手抓,只有Tesla选择了第二条路(当然在这条路上的耕耘也最深)。围绕这一话题的口水仗层出不穷,哪一方都认为自己的道路才是正确的,而对方走的是邪路。这与围绕高精地图的论战也很相似。

但作为一个汽车从业者,汽车行业的市场太大了,**大到足可以容纳多种方案在市场上并存:**混合动力方案就有增程、Dmi为代表的直连、THS行星齿轮好几种;电池方案有:三元锂、铁锂、钠电池等等;很多方案尽管有差异,但最终都能够出色地执行其任务。在当前这种技术没有显性代差的情况下,汽车行业还存在着太多性能和成本之间的博弈和取舍。因此现在的口水相当多都是为了拉拢投资人而已。

我个人想要从最接近信息本源的角度来探讨这个问题,这样结论或许会更清晰。如开头所言,极宽频谱范围内的机械波、电磁波都可以作为传递信息的工具。而在太阳光的波段分布中,可见光是能量密度最高的。也因此,人类在漫长的进化过程中,选择了390nm-760nm的可见光来高效的感知世界。

太阳光的波段分布,"可见光"的成因

但这并不意味着可见光在任何场景下都是最优的感知方案,例如夜晚可见光感知能力就会大大下降;而能感知红外线的生物在夜晚就能畅行无阻。

所以,人类将机器的感知波长也锁在390nm-760nm的可见光内,舍弃绝大部分频率的信息渠道,这是否还是一种明智的做法?

一些说法是:"人类这么多年基本只靠眼睛就开车开的非常好,因此自动驾驶只用视觉信息就够了"。然而,通过前面的描述,我们知道,任何感知系统都是有物理极限的,**且不以技术进步为转移。**人类驾驶过程中因为超出了感知极限而导致事故的原因比比皆是。

对于自动驾驶,从GNSS到毫米波,再到红外激光、可见光,每一个频率都有其特性的优势,将这些不同场景的优势融合发挥出来,才能突破人类感知的极限。不否认"增强系统智慧性"的必要性,但这种智慧性,不应当被禁锢在可见光的波长范围内。

相关推荐
地平线开发者12 小时前
ReID/OSNet 算法模型量化转换实践
算法·自动驾驶
地平线开发者12 小时前
开发者说|EmbodiedGen:为具身智能打造可交互3D世界生成引擎
算法·自动驾驶
c枫_撸码的日子16 小时前
Camx-常用接口
camera
Coovally AI模型快速验证18 小时前
YOLO、DarkNet和深度学习如何让自动驾驶看得清?
深度学习·算法·yolo·cnn·自动驾驶·transformer·无人机
Swaggy T1 天前
自动驾驶轨迹规划算法——Apollo EM Planner
人工智能·算法·自动驾驶
Monkey PilotX1 天前
机器人“ChatGPT 时刻”倒计时
人工智能·机器学习·计算机视觉·自动驾驶
luoganttcc1 天前
L4 级别自动驾驶 硬件架构设计
人工智能·自动驾驶·硬件架构
星创易联3 天前
车载网关助力无人配送车联网解决方案
车载系统·自动驾驶·车载以太网
地平线开发者4 天前
征程 6 | 自定义查表算子实现量化部署
算法·自动驾驶