多传感器融合基础之四雷达检测空间(Radar Detection Space)全面解析

多传感器融合基础之四雷达检测空间(Radar Detection Space)全面解析

雷达检测空间是多传感器融合体系中最具"物理测量"色彩的一类测量空间。与图像空间通过被动接收可见光来记录纹理、深度图空间通过主动或被动手段来获取表面距离、点云空间通过离散采样来刻画三维几何不同,雷达检测空间的核心特征 在于它直接测量电磁波在传播路径上遇到目标后反射回来的物理量------不仅包括目标在空间中的位置,更包括了目标相对于传感器的径向速度,以及反映目标材质与形状的反射强度。这种独特的物理测量能力,使雷达检测空间在恶劣天气、低能见度、长距离探测以及动态目标跟踪等场景中拥有其他测量空间难以企及的鲁棒性优势。然而,这一空间同时也是所有主流测量空间中分辨率最低、信息最稀疏、杂波干扰最严重的一种。理解雷达检测空间,不能仅将其视作"低配版点云",而必须从其独特的极坐标测量原理、多普勒速度维度、检测点稀疏性、以及它与点云和图像在信息属性上的根本差异入手,循着数学定义、数据结构、采集方式、坐标变换、邻域特性、算法生态、融合角色等维度,系统地剖析这个在自动驾驶和工业感知中不可或缺却又常被低估的测量空间。

一、基本定义与数学表示

雷达检测空间在数学上可以定义为一个由有限检测目标构成的集合,其中每个检测目标 通常至少包含径向距离 、方位角 、径向速度 和反射强度 这四个基本物理量。对于现代 4D 成像雷达,检测目标还可以包含俯仰角 ϕ,形成完整的球坐标位置表示。因此,一个通用的雷达检测可以表示为向量,或者以极坐标位置与附加属性分离的形式 ,其中 描述目标在传感器球坐标系中的位置, 携带物理属性。

这一数学表示与点云空间有着根本的不同。点云的核心是笛卡尔坐标系下的三维坐标 (x,y,z),其几何意义是绝对的空间位置,不受测量原理的直接影响。而雷达检测的原始测量是在极坐标(或球坐标)下完成的------传感器直接获得的是电磁波往返时间换算的距离 ,以及通过天线阵列相位差或波束指向获得的角度 和 ϕ。这种原生极坐标特性意味着雷达检测在距离维拥有极高的精度(毫米级甚至亚毫米级的距离分辨能力),但在角度维的精度则受限于天线孔径和波长,通常远远逊色于激光雷达。一个典型的车载毫米波雷达在距离上的分辨能力可达 0.1 米以内,而方位角分辨率可能只有 1° 到 3°,在 100 米距离上,3° 的角度误差就意味着约 5.2 米的横向位置不确定性。这种"距离精确、角度模糊 "的异方差特性是雷达检测空间最本质的几何特征 ,也是它与其他测量空间融合时最需要小心处理的数学属性。

多普勒速度 是雷达检测空间区别于所有其他被动几何测量空间(图像、深度图、点云)的最独特维度。多普勒效应使得雷达能够通过测量发射信号与接收信号之间的频率差,直接计算出目标相对于雷达的径向运动速度。这一测量是瞬时且精确的------不需要像视觉那样跨帧追踪特征点来估计光流,也不需要像激光雷达那样通过多帧目标关联来推算速度。雷达可以在单个检测周期内就给出每个检测点"在以多快的速度靠近或远离"。这一能力对于自动驾驶中的紧急制动预警、自适应巡航控制以及动态目标筛选至关重要------一个拥有高径向速度的检测点必然属于一个运动物体,而不是静止的路面或护栏,这种先验信息在目标检测和跟踪中是无价的。

多普勒效应是指当波源与观察者之间有相对运动时,观察者接收到的波的频率会发生变化的现象。这一现象由奥地利物理学家克里斯琴·多普勒于1842年首先提出。原理是 :当波源向观察者靠近时,波被压缩,波长变短,频率升高;当波源远离观察者时,波被拉伸,波长变长,频率降低。这一现象不仅适用于声波,也适用于电磁波。

反射强度 σ 通常以雷达截面积(Radar Cross Section, RCS)的形式给出,单位为分贝平方米(dBsm)。RCS 综合反映了目标的尺寸、形状、材质和相对于雷达波束的朝向。

金属物体拥有远高于人体或塑料物体的 RCS,汽车角反射器结构在某些角度下会产生极强的回波。这一维度的信息虽然在绝对值上不稳定------同一辆车在不同角度下 RCS 可能波动数十 dB------但作为一种相对特征,它可以帮助区分不同类型的障碍物,或者在融合系统中为检测点分配置信度权重。

下图,先了解一下电磁波的类型、波长(米)、频率(Hz)以及是否能穿透大气层?了解电磁波在各类波形中的位置。

二、维度:三到五维的物理测量

雷达检测空间的维度属性视雷达的先进程度而变化。传统 3D 毫米波雷达 (这里 3D 指距离、方位角、多普勒速度,而非三维空间)输出的是二维平面位置加一维速度,缺乏俯仰角分辨能力,将所有回波投影到水平面上。这种雷达无法区分一个来自天桥的回波和一个来自路面车辆的回波,因为两者在距离-方位平面上可能完全重叠。这一局限性在自动驾驶场景中曾引发多起广为人知的事故------静止的卡车因为被错误地视为天桥而被忽略,或者天桥的金属结构在特定角度下产生强回波被误判为障碍物。

4D 成像雷达 的出现打破了这一限制。通过增加垂直方向的天线阵列,4D 雷达能够分辨回波的俯仰角,从而将每个检测点的空间位置完整地表达为三维球坐标 (r,θ,ϕ)。再加上多普勒速度 vr和 RCS 值,一个 4D 雷达检测点实际携带了五个维度的物理信息。这使得 4D 雷达的输出在形式上一度被直接称为"雷达点云",以强调其与激光雷达点云在三维几何表达上的相似性。然而,必须清醒地认识到,即使被称为"点云",雷达点云激光雷达点云 在角分辨率、点密度和噪声特性上的差距仍然巨大。目前最先进的 4D 成像雷达在方位角分辨率上可以达到亚度级(约 0.5° 到 1°),俯仰角分辨率则更为有限(约 1° 到 2°),点云密度约为每秒数千到上万个点,仍远远落后于主流激光雷达每秒数十万到数百万点的密度。因此,将 4D 雷达输出称为"点云"更多是反映其数据格式的三维特性,而非暗示其密度和精度已达到激光雷达水准。

从维度完备性的角度看,雷达检测空间携带了其他任何单一传感器空间都不具备的运动维。图像和激光雷达都是对场景在某一瞬间的"快照",运动信息必须通过跨帧关联才能间接获得。雷达的多普勒速度则是直接测量,这个"直接"带来了两个关键优势:第一,速度测量的延迟极低------不需要等待下一帧数据到达就可以判断目标是否在运动;第二,速度测量对微小运动的灵敏度极高------即使目标在相邻帧之间只移动了毫米级距离,雷达也能在多普勒频移中检测到这一运动。这种亚毫米级的运动灵敏度使得雷达在检测行人微动、车辆起步、或感知远处车辆的刹车动作时具有无与伦比的早期预警能力。

三、数据结构:极坐标下的检测列表

雷达检测空间在计算机内部最原始的数据结构是一个 M×F的二维数组 ,其中 M是当前帧中检测到的有效目标数量,F是每个目标的特征维度(距离、角度、速度、强度等)。这个结构与点云的 N×3坐标矩阵表面上颇为相似,但在实质上有几个重要区别。首先,M 通常远小于点云的 N------一帧雷达检测可能只有数十到数千个检测点,而一帧激光雷达点云可能包含数万到数十万个点。其次,雷达检测列表中的每一个条目都已经经过了一层"检测"处理------原始雷达射频前端产生的是距离-多普勒频谱图或者距离-方位热力图,而输出到上层感知模块的通常已经是经过恒虚警率检测 (CFAR)筛选后的峰值点。这意味着雷达检测点在输出时就已经被判定为"这里可能有一个目标",带有初步的二值筛选结果,而点云的每个点只是"这里有一个反射面",不附带任何目标存在与否的判断。

在许多雷达传感器的中间处理阶段,数据并非检测列表,而是密集的频谱图热力图距离-多普勒图 是一个二维复数矩阵,其中一个轴是距离 bin(对应不同的往返时间),另一个轴是多普勒 bin(对应不同的频率偏移),每个单元存储该距离-多普勒位置的复数值幅度。

距离-多普勒图是一种将目标的距离信息和多普勒频移信息结合展示的图形。多普勒频移与目标的运动速度相关,通过距离-多普勒图可以同时获取目标的距离和速度信息,对于目标的检测、跟踪和识别具有重要意义。例如在汽车雷达中,可以通过距离-多普勒图判断前方车辆的距离和行驶速度,为驾驶员辅助系统提供决策依据。Signal Intensity是信号强度。

距离-方位热力图 则是将多个天线的信号经过波束成形后,形成距离和方位角两个维度的强度图。这些中间表示拥有比最终检测列表更丰富的信息------它们保留了目标周围区域的噪声背景、旁瓣结构和模糊信息------但数据量也相应增大。在一些先进的融合方案中,感知系统不再依赖 CFAR 检测器输出的稀疏列表,而是直接接收距离-多普勒图或距离-方位图,让神经网络端到端地学习如何进行目标检测。这种"原始数据级融合"代表着雷达感知从手工特征检测向深度学习转变的前沿方向。

距离-方位热力图是将目标的距离信息和方位信息以热力图的形式呈现。通过不同颜色表示不同的信号强度,能够直观地展示目标在不同距离和方位上的分布情况。在雷达监测场景中,距离-方位热力图可帮助监测人员快速了解目标在空间中的分布态势,确定目标的大致方位和距离,对于大面积区域的目标监测和预警具有重要作用。

雷达检测列表的无序性 与点云类似------打乱检测点在列表中的顺序不影响其所表示的物理场景。但由于雷达检测点数量少,且每个点的物理含义明确,通常不需要构建复杂的空间索引结构如 KD 树或八叉树。对雷达检测点按距离排序或按方位角排序往往是自然且方便的预处理操作,因为雷达检测点在距离-方位空间中分布相对均匀,按扫描顺序排列本身就接近于空间有序。这与点云在三维空间中的高度不规则分布形成了对比。

四、信息的密度与稀疏性:极致的稀疏

雷达检测空间是所有主流测量空间中信息密度最低 的一种。一帧典型车载前向雷达可能只输出几十到几百个检测点,而覆盖同一视场的相机可能拥有上百万像素,激光雷达可能有数万个点。这种极度的稀疏性源于雷达的物理原理:雷达波束在空间中照射一个较大的区域,只有当该区域内的目标回波强度明显超过噪声和杂波背景时,才会被 CFAR 检测器判定为一个有效检测。那些回波较弱的小物体(如行人、小动物)、表面光滑倾斜导致镜面反射的物体、以及被更强目标遮蔽的物体,往往无法产生足够的信噪比,因此在检测列表中完全缺失。

但雷达检测空间的稀疏性并非均匀分布。一个大型金属物体(如卡车、集装箱)可能在距离-多普勒图上产生成百上千个检测点,因为其不同部位到雷达的距离和多普勒速度略有不同,这些分布在不同距离-多普勒单元上的回波共同构成了所谓的"扩展目标"。现代雷达传感器已经具备将属于同一扩展目标的多个检测点聚类为一个"目标"的能力,输出目标级别的信息而非单纯的检测点级别信息。然而,对于较小的物体,如一个行人或一辆自行车,可能整个目标只产生一个或少数几个检测点,此时点级信息与目标级信息几乎等价。这种"一个检测点即一个目标"的极度稀疏情况在雷达数据处理中非常普遍,但也使得单帧雷达检测难以提供物体的形状和轮廓信息------雷达能看到"那里有个东西",但几乎看不到"那个东西长什么样"。

与深度图空间或点云空间的稀疏性进行比较,可以更清晰地理解雷达稀疏性的本质。深度图空间的稀疏 是由于遮挡或纹理缺失导致的局部空洞,但在有效区域内它是稠密的;点云空间稀疏 是由于传感器只在表面采样,但采样密度可以达到每平方米数十到数百个点;雷达检测空间的稀疏则更为根本------它不仅只在目标表面采样,而且采样密度极低,一个目标可能仅贡献个位数的点。这种极端的稀疏使得雷达单独难以支撑需要精细几何推理的任务(如三维形状识别、自由空间估计),它必须与其他传感器结合,由雷达提供"有没有"和"有多快"的信息,由激光雷达或相机提供"在哪里"和"长什么样"的信息。

五、采集方式:从调频连续波到脉冲多普勒

雷达的采集方式按照信号体制大致可以分为脉冲雷达调频连续波雷达调相雷达 三大类,其中车载和工业领域最为普遍的是调频连续波雷达 (FMCW)。理解 FMCW 雷达的工作方式,是理解雷达检测空间为何拥有距离、速度、角度三维同时测量能力的关键。

FMCW 雷达通过发射频率随时间线性变化的连续电磁波(啁啾信号),并同时接收目标反射回来的信号。由于电磁波在空间中传播需要时间,接收信号的频率相对于当前发射信号的频率会产生一个与目标距离成正比的频率差(拍频),同时由于目标运动引起的多普勒效应,接收信号的频率整体发生偏移。通过在一次啁啾周期内对接收信号进行傅里叶变换(距离 FFT),得到的是距离-速度耦合的拍频信号;通过跨多个啁啾周期的第二次傅里叶变换(多普勒 FFT),可以将距离和速度解耦,形成二维的距离-多普勒图。这个图中的每一个峰值对应一个具有特定距离和径向速度的潜在目标。角度测量则依赖于多天线接收阵列:不同天线由于空间位置的差异,接收到同一目标的回波存在微小的相位差,通过波束成形或超分辨算法(如 MUSIC、ESPRIT),可以从这些相位差中估计目标的方位角和俯仰角。

整个 FMCW 信号处理流水线可以被概括为"三次 FFT"------距离 FFT、多普勒 FFT 和角度 FFT------分别解析出目标的距离、速度和角度。这三个维度的解析是相互独立且同时完成的,这意味着雷达在单个测量周期内就可以获得目标的完整球坐标位置和径向速度,不需要像激光雷达那样依赖多帧追踪来推导速度。这种"一帧测速"的能力是雷达最根本的感知优势之一。

调频连续波雷达的另一个重要参数是其带宽和啁啾斜率。雷达的距离分辨率 Δr由发射信号的带宽 B 决定:,其中 c 是光速。车载雷达通常工作在 76-81 GHz 频段,可用带宽高达 4 GHz,对应的距离分辨率可达约 3.75 厘米。这对于区分相邻的车辆或行人已经足够。雷达的速度分辨率 Δvr 由相干处理时间决定,通常在 0.1 m/s 量级,远优于通过跨帧位置差推算速度的激光雷达方案。角度分辨率则由天线阵列的孔径(阵元数量乘以阵元间距除以波长)决定,是雷达三项分辨率中最薄弱的一环。

除了 FMCW 体制外,脉冲多普勒雷达 在航空和远距离探测中应用广泛,它通过发射短脉冲并测量往返时间获得距离,通过分析脉冲间相位变化获得多普勒速度。超宽带雷达穿墙雷达 则工作在更低的频率,能够穿透非金属障碍物进行探测,但其距离和角度分辨率相对较差。无论何种体制,雷达的输出最终都可以被归纳为带有距离、角度和速度信息的检测点集合,即雷达检测空间。

六、坐标系统与变换:从极坐标到笛卡尔坐标的非线性

雷达检测空间的坐标系统是其最需要精细处理的技术环节。雷达的原生测量位于传感器球坐标系 (r,θ,ϕ) 中,而大多数下游感知任务(如目标跟踪、多传感器融合、占用栅格建图)都在笛卡尔坐标系中进行。从球坐标到笛卡尔坐标的变换公式为:

这个变换看似简单,却隐藏着一个严重的非线性效应:角度测量误差在笛卡尔坐标系中被距离放大了。假设角度测量存在一个固定的标准差 σθ,那么转换到笛卡尔坐标后,横切向位置的标准差近似为 。这意味着同一个角度误差,在 10 米处可能只引起 0.17 米的位置不确定性(当),而在 100 米处则会引起 1.7 米的巨大不确定性。这种随距离线性增长的位置不确定性与激光雷达点云形成了鲜明对比------激光雷达的点位置精度由测距精度和角分辨率共同决定,但其角度分辨率通常在 0.1° 级别,远优于雷达,因此随距离的误差增长要慢得多。

这种非线性变换带来的直接后果是:雷达检测点在笛卡尔空间中呈现出高度非各向同性的误差分布。每个检测点的位置不确定度可以用一个误差椭球 来描述------在径向(距离方向)上椭球被压得很扁(高精度),在横切向(垂直于径向的方向)上椭球被拉得很长(低精度)。当我们在笛卡尔空间中对雷达检测点进行聚类、关联或与激光雷达点云进行最近邻匹配时,这种各向异性的误差结构必须被显式地纳入考虑------使用马氏距离而非欧氏距离,或者在极坐标空间而非笛卡尔空间中进行数据关联,往往是更合理的做法。

在雷达坐标系与车辆坐标系、世界坐标系之间的变换链中,雷达自身的外参标定是基础步骤。由于雷达波束不可见,且雷达检测点稀疏、噪声大,雷达与相机或激光雷达的外参标定相比激光雷达-相机标定要困难得多。常用的标定方法包括:利用角反射器在场景中创建强反射点,同时被雷达和激光雷达观测到;或者让车辆在特定轨迹上运动,利用雷达测速和车辆轮速里程计进行自标定。标定的精度直接影响雷达检测点向其他传感器空间投影的准确性,进而影响融合质量。

七、邻域与拓扑:缺乏空间聚合的独立检测

雷达检测空间在邻域与拓扑方面表现出一种独特的"原子化 "特征。在理想的 CFAR 检测器输出中,每个检测点原则上对应于距离-多普勒空间中的一个独立局部峰值。这些峰值在距离-多普勒平面上是稀疏的、彼此分离的,不像图像像素那样具有固定的网格邻域,也不像点云那样可以通过空间距离自然地定义邻域。虽然可以在笛卡尔空间中对雷达检测点进行 K 近邻或半径查询------这与点云的邻域查询完全相同------但这种查询的物理意义是有限的:两个空间上相邻的雷达检测点,可能一个来自前方车辆的车尾,另一个来自路面的杂波反射,它们在物理上不属于同一个物体,在统计上也不存在相关性。因此,在雷达检测空间中构建邻域并提取局部特征,并不像在点云空间中那样具有明确的几何意义。

这种"邻域缺失 "的特性深刻地影响了雷达检测的算法设计。雷达检测点通常被直接送入目标跟踪器(如卡尔曼滤波器),作为独立的观测输入,而不是首先进行空间聚类。跟踪器在时序上维护多个目标假设,每一个新到达的检测点根据其与现有目标假设的统计距离(通常以马氏距离衡量)被关联到某个目标,或者初始化一个新的目标轨迹。在这一框架下,检测点与检测点之间并不发生直接交互,它们各自的命运完全由它们与跟踪器中目标假设的关系决定。这与点云处理中常见的"先聚类再识别"或"先分割再检测"范式截然不同。

然而,随着 4D 成像雷达点密度的提升,某些场景下雷达检测点在空间中的分布开始呈现一定的结构性------一个大型车辆的轮廓可能在雷达点云中隐约可见,多个检测点聚集成一条线段或一个弧面。这使得一些研究者开始尝试将点云的邻域处理范式(如体素化、PointNet++、稀疏卷积)应用于雷达点云,试图从相对密集的雷达点中提取形状特征。这种做法的有效性取决于雷达的角分辨率和点密度,在高端 4D 成像雷达上已初现成效,但对于传统低分辨率雷达,检测点过于稀疏,聚合成形状的可能性很小,邻域操作反而可能引入杂波点干扰。因此,雷达检测空间的邻域拓扑并非一成不变,而是随着传感器技术的进步在逐步从"无邻域"向"可构建稀疏邻域"演化。

八、表征能力:运动感知之王,几何与语义的侏儒

雷达检测空间的表征能力呈现出一种极为不对称的格局:它在运动测量维度上拥有绝对优势,而在几何精度和语义细节上则极为薄弱。这种不对称性是雷达在融合体系中角色定位的根本依据。

在运动感知方面,雷达的多普勒速度测量是其最闪耀的王冠。径向速度的测量精度可以达到 0.1 m/s 甚至更高,而且这一测量是瞬时的------单帧即可获得,无需等待时间积累。这使得雷达在检测移动目标、估计目标运动状态、预测潜在碰撞风险等任务中拥有先天优势。在高速公路上,雷达可以在数百米外就检测到前方车辆的减速行为------即使该车辆在图像中还只是几个像素大小的模糊斑点,在激光雷达点云中只有稀疏的几个点。这种早期运动感知能力对自动驾驶的安全至关重要,因为它为决策规划提供了宝贵的额外反应时间。此外,多普勒速度作为一种独特的物理特征,可以非常可靠地将静止目标(如路面、护栏、建筑物)与运动目标(如车辆、行人、自行车)区分开来------静止目标的多普勒速度在补偿自车运动后应接近于零。这种"动静分离 "能力是图像和激光雷达难以低成本实现的。

在几何表征方面,雷达检测空间的能力受到其低角度分辨率和稀疏性的严重制约。如前所述,单个检测点在横切向上的位置不确定性随距离线性增长,远距离处的横向误差可达数米。这使得雷达无法提供精确的物体三维边界框------同一辆车的左侧和右侧检测点可能混杂在一起,无法分辨车宽;路沿和护栏的位置也是模糊的。4D 成像雷达在一定程度上缓解了这一问题,将方位角和俯仰角分辨率提升至亚度级别,使得雷达能够粗略勾勒出物体的外轮廓,但其点密度和精度仍不足以与激光雷达相提并论。在自由空间估计方面,雷达检测点的稀疏性意味着大量自由空间区域没有任何检测点来"证明"其空旷------不能因为雷达没有在某处检测到点,就认为那里没有障碍物,因为很可能只是该处的回波太弱而未被 CFAR 检测到。这与激光雷达点云的"有回波则存在表面"的逻辑不同,激光雷达的负样本(没有点的区域)具有明确的物理含义,而雷达的负样本则高度不可靠。

在语义表征方面,雷达检测空间的能力同样有限。由于缺乏颜色、纹理等外观信息,单凭雷达检测点几乎不可能区分车辆的品牌型号、识别交通标志内容、或者分辨行人的衣着姿态。RCS 值虽然在一定程度上反映了目标的材质和尺寸------金属比人体反射强,卡车比自行车反射强------但其高方差和不稳定性使得仅凭 RCS 难以进行可靠的分类。在实际系统中,雷达通常输出一个关于目标类别的初步判断(如"可能是一辆车"),但这个判断的信度远不如视觉分类。因此,雷达在语义理解中的角色往往是辅助性的------它提供一些弱分类线索,而最终的精确语义判断由相机或激光雷达-相机融合模块完成。

九、遮挡与视角:穿透能力的馈赠与多径的诅咒

雷达检测空间在遮挡与视角方面呈现出一种矛盾的双重性:一方面,电磁波对雨、雪、雾、尘埃等光学障碍物具有极强的穿透能力,这是雷达相对于相机和激光雷达最突出的环境鲁棒性优势 ;另一方面,雷达在面对金属物体遮挡和多径反射时会产生独特的伪影和虚警,这是雷达感知中最棘手的技术难题之一

先说穿透能力。毫米波雷达 的工作波长约为 4 毫米(77 GHz),这一波长远大于雨滴、雪花和雾滴的粒径,因此电磁波在穿过这些天气现象时衰减很小。相比之下,激光雷达的近红外激光 波长约为 900 纳米或 1550 纳米,与雨滴和雾滴的粒径处于同一量级,会发生强烈的散射和衰减。这就是为什么在暴雨、浓雾或沙尘暴天气中,激光雷达的性能会急剧下降,甚至完全失效,而毫米波雷达几乎不受影响。同样,雷达电磁波可以穿透某些非金属材料(如塑料保险杠、干墙、衣物纤维),这使得雷达天线可以被安装在保险杠后方或车标背后,不影响车辆外观。这种物理穿透能力是雷达在汽车工业中被广泛接受的重要工程原因------它允许传感器的隐藏式安装,提升了整车的设计自由度和防护性能。

然而,遮挡特性在金属物体面前发生了反转。雷达电磁波无法穿透金属表面,因此金属障碍物会形成绝对的遮挡盲区------一辆大卡车后方的一切对雷达来说都是不可见的,这与激光雷达和相机的遮挡行为一致。但更为棘手的是多径反射效应。雷达波束在遇到光滑金属表面时会发生镜面反射,而不是漫反射。这种镜面反射可能导致电磁波经历多次反射后才回到雷达接收天线,从而产生"鬼影 "检测点------雷达以为在某个方向某个距离上存在目标,实际上那里什么都没有,检测点只是多次反射的产物。隧道、地下车库、密集的城市峡谷中,多径效应 尤为严重,会产生大量的虚警检测,严重干扰目标跟踪和占用估计。抑制多径虚警是雷达信号处理中的经典难题,通常需要结合时域滤波 (利用虚警点的时变不稳定性)和多传感器一致性校验(如果一个雷达检测点在激光雷达和相机中都找不到对应目标,则可能是虚警)来应对。

十、处理算法:从恒虚警到卡尔曼滤波的经典大厦

雷达信号处理与点云处理、图像处理不同,它拥有一套完全独立且高度成熟的经典算法体系,这套体系在雷达诞生后的近一个世纪中逐步发展完善,至今仍是绝大多数商用雷达传感器的核心。

恒虚警率检测 (CFAR)是雷达检测空间生成的第一步,也是最为关键的一步。原始的距离-多普勒图或距离-方位图是一个密集的复数矩阵,其中每个单元包含噪声、杂波和潜在目标信号的叠加。CFAR 检测器的任务是在保持恒定虚警概率的前提下,自适应地判断每个单元是否包含目标信号。其基本思想是:对于每个被测单元,在其周围选取一组参考单元作为噪声和杂波背景的估计值,如果被测单元的能量显著高于背景估计值乘以一个门限系数,则判定为检测。根据参考单元的选取方式不同,CFAR 分为单元平均 CFAR(CA-CFAR)、有序统计 CFAR(OS-CFAR)、以及适用于非均匀杂波环境的各种改进变体。CFAR 的设计直接影响雷达的检测灵敏度和虚警率,是雷达工程师需要根据具体应用场景精细调校的核心算法。

CFAR 检测器输出的检测点列表需要被送入目标跟踪器,形成对运动目标持续稳定的跟踪轨迹。卡尔曼滤波器及其各种扩展是雷达跟踪的数学基础。一个典型的雷达跟踪器为每一个被跟踪目标维护一个状态向量(通常包含位置、速度、加速度),并通过预测-更新的递归循环来不断修正目标状态。在预测步骤中,卡尔曼滤波器根据目标运动模型(如匀速模型、匀加速模型)预测目标在当前帧的位置;在更新步骤中,用新接收到的检测点对预测进行修正。由于雷达检测点稀疏,数据关联------决定哪个检测点属于哪个已有目标轨迹------成为跟踪器设计中的核心难点。常用的关联算法包括最近邻关联(将距离预测位置最近的检测点关联给该目标)和全局最近邻关联(求解所有检测点与所有目标轨迹之间的最优二分匹配),以及更复杂的概率数据关联和联合概率数据关联(JPDA),后者在密集杂波和多目标场景中表现更好。对于机动目标------突然加速、转弯或变道的车辆------标准的线性卡尔曼滤波器可能因模型不匹配而发散,此时需要使用交互多模型算法,并行运行多个不同运动假设的滤波器,根据各模型的似然度动态切换或加权融合。

随着深度学习的兴起,数据驱动的方法也开始渗透到雷达感知领域。雷达目标检测网络可以直接对距离-多普勒图或距离-方位图进行端到端的学习,取代手工设计的 CFAR 检测器和跟踪器。这些网络通常采用卷积架构(对频谱图应用 2D CNN)或图神经网络(对检测点集进行消息传递),在特定数据集上展现出了优于经典方法的检测率和虚警率。然而,深度学习雷达感知面临着一个核心挑战------泛化性。雷达数据的特性(噪声分布、杂波模式、多径效应)高度依赖于硬件平台、安装位置和运行环境,在一个雷达型号上训练的模型很可能在另一个型号上表现不佳,在高速公路上训练的模型可能在城市峡谷中失效。这与图像领域在 ImageNet 上预训练、在各种下游任务中微调的成熟范式形成鲜明对比。因此,经典信号处理方法和深度学习方法目前在雷达领域更多的是互补而非替代关系------经典方法提供稳健的基线,深度学习方法在有充分训练数据的特定场景中提供性能提升。

十一、存储与计算:轻量级数据的计算重负

雷达检测空间在存储开销方面极为轻量。一帧典型的雷达检测输出仅包含数百个检测点,每个检测点存储距离、角度、速度、RCS 等数个浮点数,总数据量通常在千字节级别。即便考虑到距离-多普勒图等中间表示,一帧 256×256 的复数频谱图也仅约 256 KB。与动辄数 MB 的图像、数百 MB 的点云文件相比,雷达数据的存储和传输几乎不构成任何工程负担。这种轻量性使得雷达在带宽受限的嵌入式系统和无线传输场景中具有天然优势,也是雷达长期以来在汽车自适应巡航和自动紧急制动系统中被广泛采用的工程原因之一------低数据率意味着低功耗、低散热、低总线负载,整个系统的成本和可靠性都因此受益。

然而,存储轻量并不意味着计算简单。雷达信号处理的前端------多次 FFT 运算、CFAR 检测、角度超分辨估计------对实时计算能力有较高要求。FMCW 雷达需要对每个啁啾的 ADC 采样进行距离 FFT,对连续多帧的距离谱进行多普勒 FFT,对多通道数据进行角度 FFT 或波束成形,这些运算必须在极短的时间窗口内完成(通常为毫秒级),以满足实时更新频率的要求。因此,现代雷达传感器通常内置专用的数字信号处理器或硬件加速器,将原始 ADC 数据直接处理为检测点输出,不占用中央域控制器的算力。这部分前端计算发生在传感器内部,其算力需求在雷达芯片设计阶段就被精心规划。

对于上层感知系统而言,雷达数据的后处理------目标跟踪、杂波滤除、与相机和激光雷达的融合------计算开销适中。卡尔曼滤波器复杂度与目标数量成正比,通常在数百条轨迹的规模下,CPU 即可轻松完成实时跟踪。基于深度学习的雷达感知网络复杂度视输入类型而异:如果输入是稀疏检测点,使用 PointNet 类网络,计算量可控;如果输入是密集的雷达频谱图,使用 2D CNN 处理,计算量则相当于处理中等分辨率的灰度视频流。当前,一种趋势是将雷达的前端信号处理和后端感知网络进行联合设计,让神经网络的输入端尽可能靠近 ADC,甚至直接处理原始波形,以期从数据中学习到传统流水线所丢失的微弱信号模式。但这种端到端方案对算力和数据的需求大幅上升,目前仍处于研究探索阶段。

十二、融合:运动维度的注入与几何语义的校准

雷达检测空间在多传感器融合体系中扮演着一个不可替代的角色------它为融合系统注入了独特的运动测量维度,并在恶劣天气条件下提供了最为可靠的几何感知备份。雷达与其他传感器的融合可以在多个层级上发生,从低级的数据关联到高级的决策融合,不同层级解决不同的问题。

在数据层面 ,雷达检测点通常被投影到三维笛卡尔坐标系中,与其他传感器的输出在空间上对齐。最经典的融合是将雷达检测点与激光雷达点云进行关联:对于每一个雷达检测点,在激光雷达点云中寻找空间上最近的点,如果距离足够近且雷达检测的速度与激光雷达跨帧推算的速度一致,则认为两者观测到了同一个目标表面点。这种关联可以用于验证雷达检测的真实性(滤除虚警)、为激光雷达点附加速度属性、或者提高对远距离小目标的检测置信度。然而,由于雷达检测点在横切向的巨大位置不确定性,简单的欧氏最近邻关联在远距离处极易出错------雷达检测点可能偏移数米,关联到完全错误的激光雷达点上。因此,更鲁棒的关联方法通常使用马氏距离,将雷达检测的不确定度椭球纳入考量,或者直接在雷达原生极坐标空间中进行关联(在距离-方位角空间中搜索匹配),以避免笛卡尔变换带来的误差放大。

在特征层面 ,雷达提供的最独特特征------多普勒速度------可以作为融合网络的一个独立输入通道。在多传感器 3D 目标检测网络中,除了激光雷达体素特征和图像语义特征之外,雷达检测点可以被栅格化到 BEV 网格中,每个网格单元存储其内雷达点的平均径向速度、速度方差和 RCS 值。网络通过卷积或注意力机制自动学习如何利用这些雷达特征来增强运动物体的检测和分类。对于动态物体(如行驶中的车辆),其雷达速度特征明显区别于静止背景,因此雷达特征的加入可以显著降低动态目标的漏检率。一些最新的融合架构甚至利用雷达速度作为"自监督"信号来帮助网络学习场景中的运动分割------网络不需要人工标注,仅仅通过雷达速度标签就可以学会区分静止背景和运动前景。

在恶劣天气条件下,雷达与其他传感器的融合角色发生了逆转。正常天气下,激光雷达是几何感知的绝对主力,雷达是辅助;但在浓雾、暴雨或沙尘中,激光雷达和相机的性能急剧下降甚至失效,此时雷达成为唯一可靠的前向感知传感器。在这种"降级模式"下,融合系统必须能够动态调整各传感器的权重------当视觉和激光雷达的置信度因天气原因降低时,系统的感知输出应更多地依赖雷达检测。这种"自适应融合权重 "的设计对自动驾驶在恶劣天气下的安全运行至关重要。一些方案使用一个天气感知模块来估计当前环境对各传感器的影响程度,并据此实时调整融合权重;另一些方案则让融合网络通过学习自动掌握这种权重调整,在训练数据中包含各种天气条件下的标注,使网络隐式地学会在不同环境下信任不同的传感器。

十三、应用场景侧重:从自适应巡航到周界安防

雷达检测空间的应用版图以其可靠性为核心向外辐射。在汽车领域,雷达最早且最成熟的应用是自适应巡航控制(ACC)和自动紧急制动(AEB)。这两个功能对传感器有共同的需求:能够可靠地检测前方车辆的相对距离和相对速度,且必须在雨雪雾夜等各种条件下全天候工作。雷达的多普勒测速和恶劣天气穿透能力使其成为这两个功能的天然之选。事实上,在激光雷达和视觉感知被引入汽车之前,基于毫米波雷达的 ACC 系统已经在高端车型上服役了二十余年。即使在今天的最先进 L4 自动驾驶系统中,前向毫米波雷达依然被视为不可或缺的冗余安全传感器------当主感知系统的激光雷达或视觉发生失效时,雷达仍然能够提供最基本的碰撞预警和紧急制动能力,构成感知架构的最后一道安全防线。

盲区检测和变道辅助是雷达在汽车上的另一典型应用。安装在车辆后保险杠两侧的短距雷达(通常为 24 GHz 或 77 GHz)持续监测相邻车道后方区域,当检测到快速接近的车辆时向驾驶员发出警告。这类应用不要求传感器分辨物体的精确形状,只需要可靠地检测"有没有东西在快速接近",恰好契合雷达的能力优势------运动感知灵敏、安装隐蔽、不受雨雪影响。

在自动驾驶的感知流水线中,雷达还被广泛用于动态目标跟踪和速度估计。激光雷达和相机的 3D 目标检测给出了物体的空间位置和尺寸,但其速度估计需要跨帧关联,存在延迟且容易因检测丢失而中断。雷达提供的瞬时径向速度可以作为速度真值(在补偿自车运动后)输入到多目标跟踪器的更新步骤中,大大提高速度估计的精度和响应速度。一些先进的跟踪框架甚至将雷达速度作为卡尔曼滤波器中的直接观测,而不是将雷达检测点作为位置观测来间接影响速度估计------这样更能发挥雷达测速精度的优势。

在工业领域,雷达用于液位测量和过程监控已有数十年历史。安装在储罐顶部的雷达液位计向液面发射微波脉冲并接收回波,精确测量液位高度,不受温度、压力和蒸汽的影响,可靠性极高。在安防领域,周界雷达和微波对射探测器用于机场、监狱、变电站等重要设施的入侵检测,能够全天候覆盖大范围区域,且不受黑夜和恶劣天气影响。室内人体存在感知雷达(如基于毫米波的生命体征监测)则是一个新兴的消费级应用方向------雷达通过检测人体呼吸和心跳引起的微小胸部位移,能够在无隐私侵犯(不像摄像头)的前提下感知室内人员的数量、位置甚至睡眠状态,在智能家居和养老监护中展现出了独特的优势。

十四、坐标系变换关系详解:极坐标向笛卡尔坐标转换的误差传播

雷达检测空间的坐标系变换是整个多传感器融合体系中需要最严谨数学处理的一环。这里将详细阐述雷达极坐标笛卡尔坐标 转换的完整数学关系及其误差传播特性,这是理解雷达与其他传感器融合中各种设计抉择的关键。

设雷达在其本地球坐标系中检测到一个目标,测量值为 ,对应的测量噪声协方差矩阵为 。对于传统 3D 雷达,俯仰角 ϕ 通常不可测,被假设为 0。笛卡尔坐标通过非线性函数 g 获得:

由于 g 是非线性的,转换后的笛卡尔坐标的误差特性也变得复杂。忽略高阶项,通过一阶泰勒展开可以将测量噪声传播到笛卡尔坐标:

其中 是雅可比矩阵。对于水平面简化情况(ϕ=0),雅可比矩阵为:

由此可得笛卡尔坐标的协方差矩阵:

这个协方差矩阵的关键含义在于:当距离 r增大时,包含 的项迅速增大,横向不确定性急剧膨胀;而径向不确定性 保持不变,与距离无关。当 时,误差椭球在横切向被极度拉伸,其长轴几乎垂直于径向。在远距离,该椭球的长轴长度可能达到数米。这一数学事实直接指导了雷达融合算法的设计:在远距离处,雷达检测点在笛卡尔空间中的最近邻搜索几乎没有意义(横向位置太不可靠),此时数据关联应该优先使用极坐标空间中的距离度量,或者使用马氏距离:

马氏距离通过协方差的逆矩阵对各个方向进行归一化,天然地将横向的不确定性"拉伸"考虑在内,使得一个远离预测位置的雷达检测点在横向方向上仍然被认为是一个"合理"的关联候选。

十五、优缺点对比:鲁棒性之矛与分辨率之盾

将雷达检测空间与图像空间、深度图空间和点云空间进行系统性的优缺点对比,有助于更清晰地定位其在多传感器融合体系中的生态位。

相较于图像空间 ,雷达检测空间最突出的优点是全天候鲁棒性。雷达在黑暗、雨雪、浓雾中的性能几乎不衰减,而相机在这些条件下可能完全失效。雷达提供的是直接的距离和速度测量,不存在图像的尺度模糊和光流估计的延迟问题。但雷达在外观信息方面完全是一片荒漠------没有颜色、没有纹理、无法识别文字和精细类别,这在需要语义理解的任务中是致命的。图像则在这些方面拥有压倒性优势。两者的互补性极为明确:雷达负责"有没有移动的东西"和"它有多快",图像负责"它是什么"。

相较于深度图空间 ,雷达检测空间在量程和速度测量方面占有优势。深度相机的有效距离通常小于 10 米,而车载雷达可检测 200 米以上的目标。雷达的速度测量是直接且精确的,深度图则需要跨帧计算场景流来估计运动。但深度图在近距离的几何精度和密度方面远超雷达------结构光或 ToF 相机可以提供毫米级精度、百万像素分辨率的稠密深度图,而雷达只能在同样区域产生稀疏的检测点。因此,深度图主导室内和近距离的精密几何感知,雷达主导室外和远距离的鲁棒运动感知。

相较于点云空间 ,雷达与激光雷达的对比最为微妙和重要。两者的输出格式在形式上最为接近------都是空间中带有属性的离散点集------但在实质上的差距依然巨大。激光雷达点云的点密度是雷达点云的上百倍,角分辨率是雷达的数十倍,这意味着激光雷达可以提供精确的物体三维形状和轮廓,而雷达只能给出粗略的位置指示。激光雷达的测距精度和角度精度都优于雷达。然而,雷达拥有点云没有的两项致命武器:多普勒速度和恶劣天气穿透能力。在高速场景中,雷达可以瞬间感知前方车辆的急刹,而激光雷达需要等待至少一帧(通常 100 毫秒)才能通过位置差推算出速度变化,在这 100 毫秒内车辆可能已经前进了数米。在浓雾天,激光雷达的有效距离可能骤降至 30 米以内,而雷达仍然可以看到 150 米以外的障碍物。因此,在先进的自动驾驶感知系统中,雷达与激光雷达不是谁替代谁的关系,而是"好天气激光雷达做主,雷达辅助;坏天气雷达做主,激光雷达靠边 "的动态协同关系。

|-----------------------|--------------|----------------------------------|---------------------|
| 空间类型 | 数据形式 | 信息特点 | 应用场景 |
| Radar detection space | 雷达反射信号数据 | 能提供目标的距离、速度、角度等信息,对恶劣天气和光照条件适应性强 | 自动驾驶中的目标检测与跟踪、军事侦察等 |
| Image space | 二维图像像素数据 | 包含丰富的视觉纹理和色彩信息,但缺乏深度信息 | 图像识别、安防监控、人脸识别等 |
| Depth map space | 深度值矩阵 | 精确记录场景中各点的深度信息 | 增强现实、三维建模、机器人导航等 |
| Point cloud space | 三维点坐标集合 | 全面呈现物体的三维形状和空间结构 | 自动驾驶环境感知、工业检测、地形测绘等 |

十六、进一步拓展:从4D成像雷达到雷达与视觉的深度学习融合

雷达检测空间正在经历一场从传统信号处理向数据驱动智能感知的范式转型,4D 成像雷达的商用化是这场转型的硬件基础,而深度学习方法在雷达感知中的渗透则是其软件引擎。

4D 成像雷达通过大规模 MIMO 天线阵列(多发多收),在虚拟孔径上实现了等效于数百个接收通道的阵列增益,将方位角和俯仰角分辨率大幅提升至亚度级别。这种硬件革新使得雷达的输出首次具有了可以被称之为"点云"的密度和结构------行人和车辆不再只是单个检测点,而是数十上百个检测点勾勒出轮廓。这为雷达感知打开了全新的算法空间:原本只能用于激光雷达点云的体素化、稀疏卷积、PointNet++ 等方法开始被移植到雷达点云上,实现了基于雷达的 3D 目标检测和语义分割。一些前沿工作甚至展示了仅使用 4D 雷达点云(无相机、无激光雷达)就能完成车辆检测、行人检测和自由空间估计的端到端感知系统。虽然其几何精度仍不及激光雷达方案,但其全天候能力和速度感知优势使它在特定部署场景下展现出独特的竞争力。

在雷达与视觉的深度融合方面,一个令人兴奋的方向是"雷达监督视觉 "。雷达的多普勒速度是一项精确且鲁棒的物理测量,可以作为"免费"的自监督信号来训练视觉网络。例如,在没有人工标注的情况下,可以通过雷达检测到的运动物体和静止背景来生成运动分割的伪标签,再用这些伪标签训练视觉语义分割网络,使其学会区分可移动物体(车辆、行人)和不可移动背景(道路、建筑)。另一个方向是利用雷达速度来约束视觉深度估计网络------对于那些有雷达检测的像素,其深度变化应该与雷达速度保持一致,这种跨模态一致性约束可以提升单目深度估计的时序稳定性和尺度准确性。

雷达检测空间与高精地图的融合也值得关注。雷达虽然精度有限,但其检测稳定性高,且 RCS 特征对某些地物(如金属护栏、交通标志杆、路灯柱)具有特异性的响应模式。通过长时间多趟采集,将雷达回波积累到地图中,可以形成"雷达地标地图"------一种不依赖于光照、不受季节变化影响的环境表示。在定位时,实时雷达检测与预构建的雷达地标地图进行匹配,可以在 GPS 失效或视觉特征缺失的环境(如隧道、地下停车场、雪覆盖道路)中提供可靠的全局定位。这种"雷达定位"方案正在成为自动驾驶和机器人定位工具箱中一个重要的冗余选项。

从更长远的角度看,雷达检测空间可能不再仅仅以检测点列表的形式存在。随着雷达芯片集成度的提高和边缘算力的增强,未来的雷达传感器可能直接输出高分辨率的距离-多普勒-角度张量或经过神经网络处理的语义信息,使得"雷达检测空间"这一概念从稀疏点集演变为一种稠密的、多通道的、富含物理信息的测量空间。这种演变将模糊雷达与激光雷达、雷达与视觉之间的传统界限,使得感知系统能够在统一的深度学习框架下,无缝地融合所有模态的异构测量。而无论形态如何变迁,雷达所独有的多普勒速度测量能力和电磁波穿透能力,将始终是融合体系中不可替代的物理基石。