在自动驾驶的感知层,存在着两条截然不同的信仰:
一派是特斯拉信奉的**"纯视觉派",认为人只靠眼睛能开车,车也可以;
另一派是绝大多数车企(蔚小理、Waymo)信奉的 "融合感知派",认为机器必须拥有超越人类的感知能力------这就是激光雷达 (LiDAR)** 的战场。
LiDAR 不仅赋予了机器"深度"感知的能力,更是一场关于光电物理、微纳制造与信号处理的综合技术革命。本文将剥开商业包装,直击其技术内核。
01. 物理基石:从雷达方程说起
在讨论各种花哨的技术路线前,我们必须先理解制约 LiDAR 性能的物理铁律:激光雷达方程 (LiDAR Equation)。
接收端收到的光功率 PrP_rPr 可以表示为:
Pr=Pt⋅τ⋅ρ⋅Arπ⋅R2⋅ηsys⋅ηatmP_r = P_t \cdot \frac{\tau \cdot \rho \cdot A_r}{\pi \cdot R^2} \cdot \eta_{sys} \cdot \eta_{atm}Pr=Pt⋅π⋅R2τ⋅ρ⋅Ar⋅ηsys⋅ηatm
- PtP_tPt:发射功率(激光器越强,看得越远)。
- τ\tauτ:目标物体的透射率/反射特性。
- ρ\rhoρ:目标反射率(黑车 ρ≈10%\rho \approx 10\%ρ≈10%,白墙 ρ≈80%\rho \approx 80\%ρ≈80%)。
- ArA_rAr:接收孔径面积(接收透镜越大,收光越多)。
- RRR:探测距离(信号随距离的平方衰减,这比毫米波雷达的四次方衰减要好)。
- ηsys,ηatm\eta_{sys}, \eta_{atm}ηsys,ηatm:系统效率与大气传输效率(雨雾天 ηatm\eta_{atm}ηatm 下降,探测距离缩短)。
关键结论 :要看清远处的黑车(低 ρ\rhoρ,大 RRR),你要么疯狂提高发射功率 PtP_tPt,要么把接收透镜 ArA_rAr 做大。但前者受限于人眼安全,后者受限于体积。这就是 LiDAR 设计的"戴着镣铐跳舞"。
02. 波长之争:905nm vs 1550nm
激光器的光源波长选择,是 LiDAR 设计的第一道分水岭。
1. 905nm:当前的性价比之王
- 材料 :硅 (Si) 基探测器。硅工艺极其成熟,成本极低。
- 瓶颈 :人眼安全。905nm 光线能穿透人眼玻璃体直达视网膜。为了不把路人"闪瞎",发射功率被严格限制,导致探测距离很难突破 200m。
2. 1550nm:未来的贵族
- 材料 :铟镓砷 (InGaAs) 探测器。
- 优势 :1550nm 光线被眼球中的水吸收,无法到达视网膜。因此,发射功率可以比 905nm 高 40 倍以上! 轻松实现 500m+ 的探测距离,且穿透雨雾能力更强。
- 劣势:贵。InGaAs 晶圆昂贵,且光纤激光器体积较大。
03. 测距原理进阶:ToF 与 FMCW 的较量
1. 飞行时间法 (ToF) ------ 简单粗暴
发射脉冲 -> 计时 -> 接收脉冲。
R=cΔt2R = \frac{c \Delta t}{2}R=2cΔt
- 探测器进化 :
- APD (雪崩二极管):传统的感光元件,增益约 100 倍。
- SPAD (单光子雪崩二极管) / SiPM (硅光电倍增管) :工作在盖革模式,能检测到单个光子。灵敏度极高,是实现纯固态 Flash LiDAR 的关键技术。
2. 调频连续波 (FMCW) ------ 相干探测的魔法
FMCW 发射的是频率随时间线性变化的"啁啾信号" (Chirp)。
-
多普勒效应 :
反射回来的波,不仅有时间延迟(产生频率差 frf_rfr),还有因物体运动产生的多普勒频移 fdf_dfd。
- 上扫频段拍频:fup=∣fr−fd∣f_{up} = |f_r - f_d|fup=∣fr−fd∣
- 下扫频段拍频:fdown=∣fr+fd∣f_{down} = |f_r + f_d|fdown=∣fr+fd∣
- 解算 :联立方程,同时算出距离 RRR 和速度 vvv。
-
核心优势:
- 自带速度 (4D):瞬间判断对方是静止还是冲过来,无需像 ToF 那样等下一帧做差分。
- 抗干扰:只响应由于自己发射的频率产生的拍频信号,完全无视阳光和其他雷达的干扰。
04. 扫描架构:通往固态之路
如何把激光打向四面八方?
| 技术路线 | 核心部件 | 优缺点 | 代表厂商 |
|---|---|---|---|
| 机械旋转 | 电机+滑环 | ✅ 360°覆盖 ❌ 寿命短,过车规难 | 禾赛 (Pandar系列), Velodyne |
| MEMS | 微振镜 | ✅ 分辨率高,体积小 ❌ 视场角(FOV)窄,低温易失效 | 速腾聚创 (M系列), Innoviz |
| 转镜/棱镜 | 旋转多面体 | ✅ 技术成熟,易过车规 ❌ 扫描纹理不均匀 | 大疆 Livox (花瓣扫描), 华为 |
| Flash | VCSEL+SPAD | ✅ 纯固态,寿命无限 ❌ 功率密度低,只能做近距离补盲 | Ouster, ibeo |
| OPA | 硅光相控阵 | ✅ 扫描速度快,芯片级集成 ❌ 光损耗大,旁瓣难消,制造难 | Quanergy (已倒闭), 实验室阶段 |
特别介绍:大疆 Livox 的非重复扫描
传统的机械雷达是重复扫描 ,每一帧扫的地方都一样。
大疆利用双棱镜(Risley Prisms)产生菊花状 (Rosette) 扫描轨迹。随着时间推移,扫描线会覆盖整个视场,时间越长,分辨率越高。这种方案极大降低了硬件成本。
05. 算法层:从点云到认知
雷达吐出来的是每秒几十万个 (x,y,z,reflectivity)(x, y, z, reflectivity)(x,y,z,reflectivity) 坐标点,如何让车看懂?
1. 点云预处理
- 去噪:剔除雨雪造成的"鬼影"点(通常雨滴反射强度低,且没有连续的空间结构)。
- 去畸变:车在动,雷达在转,导致一圈扫下来起点和终点对不上(运动畸变),需要结合 IMU 数据进行校正。
2. 感知算法 (Perception)
- 3D 目标检测 :使用深度学习网络(如 PointPillars , VoxelNet)把点云划分成"体素" (Voxel),框出车辆、行人、骑行者。
- 路面分割:区分哪里是路面,哪里是路沿 (Curb)。
3. 定位与建图 (SLAM)
- LOAM / Lego-LOAM:经典的激光 SLAM 算法。通过提取点云中的"线特征"(电线杆、墙角)和"面特征"(地面、墙面),与上一帧进行匹配,算出车子走了多远,同时构建高精地图。
06. 行业终局推演
激光雷达的摩尔定律正在生效。
- 芯片化 (SiP):把激光器、探测器、处理电路全部封装到一个芯片里,将是降低成本的唯一路径。
- 融合化 :未来的传感器可能不再分"摄像头"和"雷达",而是出现 RGB-D 传感器------既有摄像头的色彩分辨率,又有雷达的深度信息。
- 甚至消失?:如果纯视觉算法(Occupancy Network)进化得足够快,LiDAR 可能会像当年手机上的红外接口一样,完成历史使命后退场。但至少在未来 10 年,它仍是 L3+ 自动驾驶不可或缺的安全冗余。