Online Monocular Lane Mapping

IROS 2023 港科大

文章链接：http://arxiv.org/abs/2307.11653

github：GitHub - HKUST-Aerial-Robotics/MonoLaneMapping: Online Monocular Lane Mapping Using Catmull-Rom Spline (IROS 2023)

动机

摆脱高精地图，使用车端的传感器来实现车端的实时建图，支撑更上层的决策规划任务，其中面临的挑战是：（1）感知车道线也是有噪声的存在或者错误、漏检、误检等，所以直接使用感知的输出鲁棒性不是很高（2）车端需要一个自车前后一定范围内的局部地图，需要使用SLAM相关的技术结合感知的输出在时序和空间上拼接一个局部的地图。

摘要

本研究提出了一种基于单目相机和里程计的实时车道线建图系统，用于生成基于样条的车道地图。我们提出的技术将车道关联过程建模为一个二分图分配问题，并通过结合Chamfer距离、位姿不确定性和横向序列一致性来为边赋权。此外，我们精心设计了控制点初始化、样条参数化和优化方法，以逐步创建、扩展和精炼样条。与先前使用自建数据集评估性能的研究不同，我们的实验是在公开可访问的OpenLane数据集上进行的。实验结果表明，我们的方法在车道关联、里程计精度和整体车道地图质量方面都有所提升。

系统架构：

该块图示了提出的单目车道映射系统的整个流程。该系统分为两个部分：车道跟踪和地图优化。前者用于车道标记关联和姿态更新，而后者用于样条曲线的初始化、扩展和优化。右侧显示了因子图。与传统的二进制视觉因子不同，优化过程中涉及到了点到样条曲线的因子，用于优化四个控制点地标。

A 3D车道线检测

HDMapNet和MapTR或者其他直接从BEV图像中检测车道的算法，不能恢复高度信息

B. Lane Mapping

文献 $13$ ， $14$ 中的研究采用了语义分割与深度信息或平坦地面结合，重建三维车道点云。然而，通过姿态积累点云会使车道地图的大小增大。研究人员 $15$ ， $16$ 提出了创建栅格图来减少地图大小，但栅格图也引入了量化误差。一种更好的方法是使用多边形线来逼近车道，并估计每个节点的位置和不确定性 $17$ ， $8$ 。然而，这种表示方法在一些曲线路段场景中显然不够充分。另一种选择是样条 $18$ ， $19$ ，它紧凑且自然连续，但缺点是难以进行控制点初始化、扩展和优化。尽管已经提出了基于样条辅助的激光雷达映射方法 $20$ ， $21$ ，但这些方法不能直接用于单目车道映射，因为它们依赖于高精度的激光雷达测量数据。

此外，一些基于深度学习的在线建图方法 $9$ ， $10$ 展现了令人印象深刻的结果。然而，只有少数研究实现了时间融合，以提高地图的一致性和准确性。

与以往的研究相比，我们的方法不需要激光雷达（LiDAR）或平坦地面假设。相反，我们直接从单目相机预测三维车道标记。为了实现这一目标，我们的方法利用了Catmull-Rom样条，这使得能够高效地建模和优化车道标记的复杂性和常常弯曲的特性。

Catmull-Rom样条是一种常用于计算机图形学中的平滑曲线表示方法，特别适用于需要在给定控制点之间插值并保证连续性和光滑性的场景 。在车道建图中，采用这种样条模型可以有效处理车道的弯曲形状，同时减少由传统方法中常见的量化误差或计算复杂性带来的问题。通过这种方法，我们不仅能够高效地生成三维车道标记，而且避免了对高精度传感器的依赖，从而提升了系统的灵活性和可扩展性。

C Edge-based VO

在本研究中，考虑到Catmull-Rom样条的特点，我们设计了一种粗到细的参数化方法，用于寻找点到曲线的最近邻（即足点），计算残差，并使用数据到模型的方式进行优化。此外，所检测到的车道是自然且独特的，作为一种语义边缘

2 方法

A. System Overview

该系统仅使用单目相机和里程计（例如 VIO、LIO）作为输入，不需要先验的导航地图或航拍照片，输出以样条曲线表示的紧凑型车道标记地图。具体来说，所提出的框架包含两个子系统：车道跟踪和地图优化。在车道跟踪中，神经网络直接根据输入图像预测 3D 车道标记。然后，预测结果经过进一步处理以满足后续需求（详见 III-B.1 节）。随后，处理后的车道标记与地图中的车道标记进行关联，并结合里程计提供的位姿（详见 III-B.2 节）。最后，基于关联结果更新位姿（见 III-B.3 节）。在地图优化中，样条首先从头初始化，或者基于新获取的检测结果扩展原有样条（见 III-C.1 节）。最后，采用增量优化框架 iSAM2 $28$ ，将新观测结果添加进来，逐步更新样条。

B. Lane tracking

在这项研究中，我们使用Persformer $12$ 来获得车道检测结果，其中包括无序的车道标记点及其相关的实例级标签。此外，我们区分车道的表示方式，包括观测（检测）和地标（地图）。特别地，对于网络预测结果，考虑到其稀疏性和噪声，我们首先将其转换为本地参考框架（LRF），其中车道的主要方向与X轴对齐。随后，我们对X-Y和X-Z坐标进行三次多项式拟合，并以特定分辨率进行采样（在我们的实验中设定为0.5米）。因此，车道观测结果可以表示为