视觉单模态

m0_6501082422 天前
论文阅读·自动驾驶·视觉单模态·交通灯状态检测·flashlightnet
FlashLightNet:实时检测与分类静态和闪烁交通灯状态的端到端深度学习框架在自动驾驶和智能交通系统的发展进程中,交通灯的准确检测与状态分类是保障车辆安全导航和实时交通管理的核心技术之一。现有方案大多聚焦于静态交通灯(红、黄、绿)的识别,却忽视了闪烁交通灯(闪红、闪黄)这一关键场景,而这类闪烁信号在警示、紧急场景中起着重要作用。同时,传统方法在复杂光照、遮挡、环境噪声等实际路况下的鲁棒性不足,且难以满足实时性要求。
m0_6501082422 天前
论文阅读·自动驾驶·位置编码·视觉单模态·多视角3d目标检测·petr·3d位置信息与2d特征
PETR:多视图 3D 目标检测的位置嵌入变换新范式在自动驾驶系统中,基于多视图图像的 3D 目标检测因成本优势成为研究热点。传统方法多从单目目标检测视角切入,而近年来 DETR 框架凭借端到端检测的创新性受到广泛关注。DETR3D 作为 DETR 在 3D 领域的延伸,通过将 3D 参考点投影回图像空间采样 2D 特征实现检测,但这种 2D-to-3D 变换存在参考点定位不准、缺乏全局特征学习、特征采样流程复杂等问题,限制了其实际应用。
m0_6501082423 天前
论文阅读·自动驾驶·uniad·ad全栈统一框架·端到端闭环·目标导向的任务协同·视觉单模态
UniAD:面向规划的端到端自动驾驶统一框架在自动驾驶技术发展过程中,传统模块化方案(感知、预测、规划独立部署)存在信息丢失、误差累积等问题,而多任务学习范式又易出现 “负迁移” 现象。为解决这些痛点,上海 AI 实验室等机构联合提出了UniAD(Unified Autonomous Driving) —— 一个以规划为核心导向,融合全栈驾驶任务的端到端统一框架。
我是有底线的