本推文对2025年自动驾驶领域的顶会《IEEE Intelligent Vehicles Symposium》进行了分析。对已被接收论文的关键词与研究主题进行了汇总,并对其中的研究热点进行了深入分析,希望能为相关领域的研究人员提供有价值的参考。
本文作者邓镝,审校王一鸣。
一、会议介绍

IEEE Intelligent Vehicles Symposium(IV)是由IEEE智能交通系统协会(ITSS)主办的年度顶级学术会议。2025年该会议将于罗马尼亚克卢日-纳波卡举办,诚邀来自高校、企业及政府机构的研究人员、学者与行业实践者,提交其在智能车辆及智能车路协同领域的最新研究论文、仿真挑战赛成果及应用案例。会议涵盖主旨报告、技术分会场、海报展示、专题教程、专题研讨会、展览以及工业界演示与挑战赛等多种形式,并为全球参会者精心打造了特色社交活动。
会议官网:https://ieee-iv.org/2025/
二、热点分析
本文对2025年该会议所接收的论文进行了系统归纳。图1为基于论文高频词生成的词云图,表1总结了部分论文的标题及研究主题,旨在为自动驾驶等相关领域的研究人员提供方向上的参考。

图 1 2025 年 IEEE IV 研究热点词云图
表 1 2025 年 IEEE IV 接收的部分论文(共 33 篇)和研究摘要
|------------------------------------------------------------------------------------------------------------------------------------|---------------------------------------------------------------------------------------------------------------------------------------|
| 标题 | 研究摘要 |
| 3D Segment-based Road Boundary Extraction Method via Spatio-Temporal Analysis | 提出一种基于时空分析的3D LiDAR道路边界提取方法,通过粗到细策略实现路缘检测和植被分割,无需拟合或聚类算法即可生成详细道路地图。 |
| 3D Shape Adaptation Across Datasets for Weakly Supervised Monocular 3D Object Detection | 提出SAWM3D框架,通过跨数据集的3D形状自适应优化,仅使用2D标注实现弱监督单目3D目标检测,无需额外传感器校准。 |
| 3D Shape Transfer Learning for Enhanced Monocular 3D Object Detection | 该研究提出了一种通过跨数据集的3D形状迁移学习来增强单目3D物体检测性能的框架STLM3D,无需依赖额外传感器的严格对应关系,在KITTI基准测试中达到了最先进性能。 |
| A Chef's KISS-Utilizing semantic information in both ICP and SLAM framework | 该研究通过将语义信息整合到KISS-ICP和Cartographer框架中,提出了一种改进的LiDAR SLAM方法,在KITTI数据集上显著降低了绝对轨迹误差并实现了动态物体过滤。 |
| A Concise Survey on Lane Topology Reasoning for HD Mapping | G该论文系统综述了高精地图中车道拓扑推理技术的演进,将方法分为程序建模、航空影像和车载传感器三大范式,分析了从早期规则方法到基于Transformer和GNN的深度学习方法的发展,并讨论了当前挑战与未来方向。 |
| A Generalized Waypoint Loss for End-to-End Autonomous Driving | 论文提出了一种解耦横向和纵向分量的广义航点损失函数,并通过新型集成技术提升了端到端自动驾驶的安全性和性能。 |
| A Glimpse into the Future: An Inverse Soft Q-Learning's Soft Actor-Critic Approach for Pedestrian Path Prediction | 该研究提出了一种基于逆软Q-learning SAC框架的行人轨迹预测方法,通过结合场景信息和注意力机制学习行人行为策略,在多个基准数据集上取得了与最先进方法相当的结果。 |
| Adaptive Semantic Segmentation of Traffic Scenes via Frequency Domain Analysis | 提出一种基于频域分析的交通场景自适应语义分割方法,通过频域风格对齐、小波变换内容增强和卷积增强注意力模块,实现了最先进的性能。 |
| Advancements in Enhancing GNSS RTK Positioning Accuracy and Integrity for Automated Driving | 该研究通过开发基于特征地图的鲁棒RTK算法、结合3D城市模型进行信号传播分析,并引入协同定位方法,显著提升了城市环境中自动驾驶车辆GNSS定位的精度与完整性。 |
| BEV-LLM: Leveraging Multimodal BEV Maps for Scene Captioning in Autonomous Driving | 该研究提出BEV-LLM模型,通过融合LiDAR点云和多视角图像生成鸟瞰图特征,结合新型绝对位置编码实现自动驾驶场景的三维描述,在保持轻量化(1B参数)的同时达到竞争性性能,并发布了两个新数据集用于评估。 |
| Beyond object detection with existence maps for anchor-based deep learning models | 该研究提出了一种名为存在图的可视化方法,通过提取基于锚点的深度学习模型内部知识来显示物体存在概率,并结合标准输出补充检测结果和校准置信度,从而提升检测精度和模型可解释性。 |
| Biasing the Driving Style of an Artificial Race Driver for Online Time-Optimal Maneuver Planning | 提出了一种基于非线性模型预测控制的新方法,通过引入基于先前规划轨迹的终端成本和出口速度最大化项,使人工赛车手能够在线实时调整驾驶风格,实现从早顶点到晚顶点操作的偏置,并在计算效率和圈速性能上接近离线最优解。 |
| Boundary-Guided Trajectory Prediction for Road Aware and Physically Feasible Autonomous Driving | 该研究提出了一种边界引导的轨迹预测框架,通过提取可行驶方向的左右边界并利用叠加路径和纯追踪运动学层生成物理可行且符合道路约束的轨迹,显著提高了对未见道路拓扑的泛化能力并消除了不可行预测。 |
| Calibrating the Full Predictive Class Distribution of 3D Object Detectors for Autonomous Driving | 该研究提出了一种新的校准度量标准Full D-ECE和两种辅助损失函数,用于校准3D物体检测器的完整预测类别分布,并在Waymo数据集上评估了多种校准方法在三种不同检测器上的效果。 |
| Connected Vehicle Experiments on Virtual Rings: Unveiling Bistable Behavior | 该研究通过虚拟环形实验和数值分析揭示了连接自动驾驶车辆在特定控制参数下表现出的双稳态行为,即系统可收敛于稳定平衡点或稳定极限环,为CAV控制设计提供了关键参数调优依据。 |
| Cross-Level Sensor Fusion with Object Lists via Transformer for 3D Object Detection | 提出一种基于Transformer的跨层级传感器融合方法,将高抽象级别的物体列表信息与原始相机图像进行端到端融合,通过查询去噪和可变形高斯掩码增强3D物体检测性能。 |
| Deep Deterministic Policy Gradient method for Autonomous Vehicle Maneuvering through Multimodal LiDAR and RADAR Sensor Fusion | 该研究提出了一种融合LiDAR和RADAR传感器的多模态方法,结合DDPG算法和时序差分更新,提升了自动驾驶车辆在CARLA模拟器中的环境感知和决策能力,实现了100%任务完成率和25%更高的峰值奖励。 |
| Diffusion Models for Safety Validation of Autonomous Driving Systems | 本研究提出了一种基于去噪扩散模型的自动驾驶系统安全验证框架,通过在四路交叉口场景中生成导致碰撞的传感器噪声序列,实现了无需外部数据集和系统先验知识的高效故障样本生成。 |
| Dynamic Intent Queries for Motion Transformer-based Trajectory Prediction | 该研究通过将静态意图点替换为基于地图的动态意图点,提升了MTR模型在车辆轨迹预测中的准确性,尤其在长时预测和合法驾驶场景中表现更优。 |
| Dynamic Objective MPC for Motion Planning of Seamless Docking Maneuvers | 提出一种动态目标模型预测控制方法,通过动态权重分配和目标分配,将路径跟随和精确位姿定位统一在一个算法中,实现无缝对接操作。 |
| Edge-Deployable Spatiotemporal Modeling Network for Vehicle Behavior Recognition | 该研究提出了一种边缘可部署的时空建模网络,通过高效时空建模块和通道增强空间建模块交替堆叠,在减少参数和计算量的同时实现车辆行为识别,适用于边缘设备部署。 |
| Efficient Data Representation for Motion Forecasting: A Scene-Specific Trajectory Set Approach | 本研究提出了一种利用地图信息和场景分类生成场景特定轨迹集的方法,通过递归分布子采样(RIDS)优化轨迹集,在保持竞争性位移误差的同时显著提高了驾驶区域合规性。 |
| Efficient Extrinsic Manual-Calibration Method for Vehicle-Mounted Surround View Cameras Using Relative Pose Estimation | 提出了一种利用双向优化相对位姿估计的车辆环视相机外参手动标定方法,有效减少了传统方法中误差累积和标定板精确放置的需求。 |
| Empirical Spatial Error Bounds for Reliable Semantic Segmentation of Pedestrians and Riders | 该研究通过分析167个语义分割模型在Cityscapes数据集上的表现,提出了一种基于垂直像素位置的空间误差界限方法,以评估模型对行人和骑行者等易受伤害道路使用者的可靠检测能力,发现mIoU指标与减少关键区域误报的相关性较弱,而与降低误报的相关性较强。 |
| Enhanced LIO-Based Localization System with Online Map Update for Robust Mining Tunnel Operations | 提出一种融合多激光雷达与场景特征、具备在线地图更新能力的增强型激光惯性里程计系统,用于解决煤矿隧道环境几何特征稀疏、动态变化下的鲁棒定位问题。 |
| Good Enough to Learn: LLM-based Anomaly Detection in ECU Logs without Reliable Labels | 该研究提出了一种基于解码器架构的大语言模型,通过熵正则化技术处理不可靠标签,实现了在ECU通信日志中的异常检测。 |
| Graph-based Path Planning with Dynamic Obstacle Avoidance for Autonomous Parking | 提出了一种基于时间索引混合A*算法的自主停车路径规划方法,通过动态障碍物预测和自适应中间目标选择,在复杂停车场景中实现高效安全的动态避障。 |
| GripMap: An Efficient, Spatially Resolved Constraint Framework for Offline and Online Trajectory Planning in Autonomous Racing | 该研究提出了一种在Frenet坐标系中空间解析车辆动力学约束的GripMap框架,通过局部抓地力缩放因子适应赛道不同区域的抓地力变化,实现了离线轨迹优化和在线规划中的动态约束调整,提升了自动驾驶赛车的圈速性能和安全性。 |
| HiLO: High-Level Object Fusion for Autonomous Driving using Transformers | 本文提出了一种基于Transformer的高层目标融合方法HiLO,通过改进自适应卡尔曼滤波和引入新型融合架构,在自动驾驶中实现了比传统方法更高的F1分数和平均IoU,并在大规模真实数据集上验证了其跨域泛化能力。 |
| Highly Accurate and Diverse Traffic Data: The DeepScenario Open 3D Dataset | 该论文介绍了DeepScenario Open 3D Dataset (DSC3D),这是一个通过单目无人机追踪管道获取的高质量、无遮挡的6自由度边界框轨迹数据集,包含超过17.5万条14类交通参与者的轨迹,覆盖五个不同地点,旨在提升自动驾驶系统的环境3D表示能力。 |
| HotShot: A Loss-Guided Data Augmentation and Curriculum Learning Technique for the Task of Semantic Segmentation | HotShot是一种结合数据增强和课程学习的语义分割训练技术,通过模型预测损失指导裁剪区域选择,提升模型性能,尤其改善困难类别的分割效果。 |
| How Hard is Snow? A Paired Domain Adaptation Dataset for Clear and Snowy Weather: CADC+ | 该研究提出了CADC+数据集,通过配对真实晴朗和雪天驾驶序列来评估雪对3D物体检测的影响,并验证了雪同时引入随机和认知不确定性。 |
| Human-Aided Trajectory Planning for Automated Vehicles through Teleoperation and Arbitration Graphs | 提出了一种基于仲裁图的远程辅助方法,使远程操作员能够通过调整规划约束来扩展自动驾驶车辆的运行设计域,无需修改现有系统组件即可解决车辆无法自主处理的场景。 |
本文还对论文中出现的高频关键词(前10名)进行归类整理和统计,结果如表2所示。
表 2 高频关键词统计结果
|------------------------|----------|
| 关键词 | 出现次数 |
| Data | 43 |
| Autonomous Driving | 40 |
| Learning | 40 |
| Detection | 36 |
| Prediction | 31 |
| Object | 30 |
| 3D | 27 |
| Autonomous Vehicle | 24 |
| Object Detection | 20 |
| Dataset | 20 |
| LiDAR | 15 |
| Multi-Modal | 14 |
三、总结
从整体上看,这批论文高度集中于环境感知、三维建模、数据驱动等方向。这些研究热点既反映了传感器与计算能力提升所带来的技术可能性,也体现了自动驾驶在复杂真实环境中部署所面临的关键挑战。
**三维感知仍然是自动驾驶研究中最为核心的方向之一。**大量工作围绕LiDAR、毫米波雷达与视觉传感器展开,重点关注三维目标检测、道路结构理解以及高精度地图构建等问题。相关研究不仅致力于提升感知精度,还强调实时性与工程可部署性,例如基于分段建模的道路边界提取、复杂环境下的三维建图等。
**多传感器融合是另一显著研究热点。**相关工作尝试结合摄像头、激光雷达、雷达等多源数据,以提升系统在恶劣天气、弱光或遮挡条件下的鲁棒性。部分研究还关注跨数据集、跨场景条件下的模型适配问题,探索如何缓解数据分布偏移对感知性能的影响。
目标检测领域的相关研究围绕技术性能提升与场景适配展开,主要聚焦于3D目标检测精度优化。一些论文结合多传感器融合、迁移学习、弱监督学习等方法减少对标注数据或额外设备的依赖。同时也有研究探索新型框架与工具,如引入Transformer架构增强特征融合能力、设计校准度量标准与损失函数提升检测可靠性,开发可视化方法与模型优化技术来改善检测的可解释性与效率。部分论文还关注了特殊场景适配,通过域自适应、频域分析等手段应对复杂环境干扰,并构建高质量数据集来支撑模型训练与验证,以满足自动驾驶等领域对目标检测的高精度、高鲁棒性需求。
**仿真与合成数据在论文中占据了重要位置。**相关研究通过高保真仿真平台或模拟传感器数据,构建可控、可扩展的数据环境,用于算法验证、极端场景测试以及模型训练数据增强。这类工作在降低真实数据采集成本的同时,也为安全关键场景的系统验证提供了重要支撑。