文献中涉及的主要知识点梳理及所提框架简介:
-
自动驾驶系统的模块化:现代自动驾驶系统通常被分解为顺序执行的模块化任务,包括感知(perception)、预测(prediction)和规划(planning)。
-
多任务学习(Multi-task Learning, MTL):在自动驾驶领域,多任务学习是一种常见的方法,它通过共享特征提取器来同时训练多个任务特定的模型。
-
端到端(End-to-End)学习:与多任务学习相对,端到端学习将所有模块(从感知到规划)作为一个整体进行训练,以直接优化最终的规划性能。
-
感知模块:包括3D目标检测、跟踪和在线映射(online mapping),这些模块负责理解车辆周围的环境。
-
预测模块:包括运动预测(motion forecasting)和占用预测(occupancy prediction),这些模块预测其他车辆和障碍物的未来行为。
-
规划模块:负责根据感知和预测的信息来规划车辆的安全路径。
-
统一自动驾驶(Unified Autonomous Driving, UniAD):文献中提出的一个全面的框架,它将所有驾驶任务集成在一个网络中,以规划为导向,优化各个模块以促进规划任务。
-
基于查询的设计(Query-based Design):UniAD使用基于查询的设计来连接不同的模块,这有助于减少上游预测的累积误差,并灵活地建模多种交互。
-
Transformer和注意力机制:在UniAD框架中,使用了基于Transformer的解码器结构来处理感知和预测任务,利用注意力机制来捕捉实体间的不同交互。
-
非线性优化:在运动预测中,为了处理上游模块的预测不确定性,采用了非线性平滑器来调整目标轨迹,使其在物理上可行。
-
实例级和场景级表示:在占用预测中,同时使用实例级和场景级表示来预测未来的占用网格图。
-
规划的安全性:在规划模块中,通过优化策略来避免与预测的占用区域发生碰撞,确保规划的安全性。
-
nuScenes基准测试:文献中在nuScenes基准测试上验证了UniAD的有效性,这是一个具有挑战性的真实场景自动驾驶数据集。
-
计算复杂性和资源限制:在实现这些高级自动驾驶功能时,需要考虑计算资源和算法复杂性,以确保系统可以在实际的车辆硬件上运行。