基于多模型融合的交通灯状态感知系统

1. 概述

红绿灯检测是自动驾驶感知系统的核心模块之一,负责实时识别交通信号灯的状态(红、黄、绿、黑、未知)及倒计时信息,为决策规划提供关键输入。本系统采用 "检测 + 分类"两阶段架构,结合多模型推理、高精地图融合、时序滤波等策略,在复杂光照(白天/黑夜)、多城市场景下实现高精度、高鲁棒性的感知能力。


2. 系统架构

白天
黑夜
Camera Frame
光照判断
Daytime Detector
Nighttime Detector
Detection Results
Crop Traffic Light ROI
Classification Model
Color: Red/Green/Yellow
Temporal Smoothing
Fuse with HD Map
Final Traffic Light State


3. 检测模型(Detection)

3.1 功能

  • 在整幅图像中定位所有交通灯的位置(边界框)
  • 输出:[x1, y1, x2, y2, confidence]

3.2 模型选型

场景 模型标识 架构 输入尺寸 特点
白天 xxx_day_v4 YOLOX-s 1920×1088 高精度,适应强光/阴影
黑夜 xxx_night_v3 RTMDet 1920×1088 抗低光、防车灯干扰
裁剪精细检测 xxx_crop YOLOX-tiny 动态ROI 提升小目标召回率

优化策略

  • 白天模型:通过分辨率升级、两步训练(先检测后多属性)、加入读秒灯数据提升性能。
  • 夜间模型:基于轻量化检测头压缩模型,确保车载芯片推理延迟达标;持续扩充多城市夜景数据。

RTMDet(Real-Time Multi-Task Detector) 是由 OpenMMLab(商汤科技开源团队) 于 2022 年底推出的一系列高性能、高效率的实时目标检测模型,专为工业部署和边缘计算场景设计。

模型 输入尺寸 mAP (%) 参数量 (M) FLOPs (G) 推理速度 (FPS, V100)
RTMDet-t 640 41.1 13.5 38 120+
RTMDet-s 640 46.0 21.8 63 80+
RTMDet-m 640 50.2 40.0 115 50
YOLOX-s 640 40.5 9.0 26.8 ~60
YOLOv8-s 640 44.9 11.1 28.6 ~70

YOLOX-s 是 YOLOX 系列的轻量级版本。

模型 输入尺寸 mAP@0.5:0.95 推理速度 (Tesla V100) 特点
YOLOv3 416 33.0% ~50 FPS 首个实用化 YOLO
YOLOv4 608 43.5% ~30 FPS 引入 CSP、PANet
YOLOv5-s 640 37.4% ~140 FPS 工程友好,PyTorch 实现
YOLOX-s 640 40.5% ~90 FPS Anchor-Free + 解耦头 + SimOTA

4. 分类模型(Classification)

4.1 功能

  • 对检测框内的区域进行颜色分类
  • 输入:96×96 裁剪图
  • 输出:Red / Green / Yellow / Unknown

4.2 模型选型

| 模型标识 | 架构 | FLOPs |

|----------|------|-------|------|

| xxx_cls_v2 | ResNet-18 改进版 | 0.334G

ResNet 分类模型(Residual Network,残差网络)是深度学习中用于图像分类的经典卷积神经网络架构,由微软研究院的 He Kaiming 等人于 2015 年提出,并凭借其突破性的设计赢得了 ImageNet 2015 图像分类冠军。

xxx_cls_v2 模型即基于 ResNet-18 改进而来,专门用于对裁剪后的交通灯区域进行高精度颜色分类(红/绿/黄/未知)。

优势

局部放大后分类可显著提升颜色识别准确率,尤其在逆光、过曝、夜间等挑战场景。


5. 交通灯检测器处理逻辑

5.1 核心流程

  1. 场景判断

    • 根据环境光照强度或时间,选择白天/黑夜检测模型。
  2. 主检测

    • 运行对应检测模型,获取初始交通灯候选框。
  3. ROI 裁剪与二次检测(可选)

    • 若检测到多个正面灯,计算包围盒并动态裁剪 ROI。
    • 使用精细检测模型对 ROI 进行二次检测,提升小目标召回。
  4. 结果融合

    • 合并主检测与裁剪检测结果。
    • 处理单灯多信号、倒计时关联等复杂情况。
  5. 分类

    • 对每个有效检测框裁剪为 96×96,送入分类模型。
  6. 后处理与滤波

    • 尺寸过滤:剔除不符合高精地图先验的异常框。
    • 投票机制:对同类灯(如所有正面圆形灯)进行颜色投票。
    • 时序平滑:维护颜色历史窗口,避免状态闪烁。
    • 倒计时处理:通过数字状态表实现跳变预测与平滑。
  7. 地图融合

    • 将检测结果与高精地图中的交通灯 ID 匹配。
    • 利用地图先验验证投影位置,过滤误检。
    • 支持直行灯状态同步至转向灯。
  8. 输出

    • 最终交通灯列表,包含:
      • 状态(红/绿/黄/黑/未知)
      • 倒计时(秒)
      • 置信度
      • 关联的地图 ID

6. 性能指标

指标 目标
检测 mAP@0.5 ≥95%
分类准确率 ≥98%
端到端延迟 ≤100ms(含检测+分类)
倒计时识别率 ≥90%(≥3秒时)
夜间漏检率 ≤2%

7. 未来方向

  1. 端到端替代:探索统一检测-分类架构。
  2. 3D 交通灯感知:结合深度估计,减少对高精地图依赖。
  3. 在线学习:利用运营数据自动更新模型。
  4. 跨域自适应:提升新城市零样本迁移能力。
  5. 多摄像头融合:融合前视+侧视,解决遮挡问题。

8. 结论

本红绿灯检测系统通过 "场景自适应模型 + 两阶段处理 + 多源数据驱动 + 高精地图融合" 的综合策略,在真实道路环境中实现了稳定可靠的交通灯状态感知,为高级别自动驾驶提供了关键安全保障。

相关推荐
陈广亮12 小时前
Claude Code Hooks 深度指南:让 AI 编程工具真正融入你的工作流
人工智能
加勒比海带6612 小时前
目标检测算法——低空智能实验室开放数据集汇总附下载链接【点赞+收藏】
大数据·图像处理·人工智能·python·深度学习·目标检测·计算机视觉
机器之心12 小时前
OpenAI也搞「Mythos」?网络安全版GPT-5.4-Cyber亮相
人工智能·openai
沐曦股份MetaX12 小时前
沐曦股份曦云C系列GPU Day 0适配MiniMax M2.7 澎湃算力支持“自进化”大模型
人工智能·开源
xixixi7777712 小时前
AI自主挖洞 + 通信网络扩散:全域风险指数级放大,如何构建密码-沙箱-终端联动闭环?
开发语言·网络·人工智能·ai·大模型·php·通信
颜酱12 小时前
智能体与工作流:从「想做一个应用」到「能跑通一条链」
前端·javascript·人工智能
火山引擎开发者社区13 小时前
不止对话,更能执行!火山引擎 Mobile Use Agent 全新升级,解锁企业级移动 AI 执行力
人工智能
AI茶水间管理员13 小时前
如何让LLM稳定输出 JSON 格式结果?
前端·人工智能·后端
llm大模型算法工程师weng13 小时前
AI中台:企业智能化转型的“新引擎”
人工智能
PILIPALAPENG13 小时前
第2周 Day 4:英语 Agent Web 版上线:从命令行到浏览器
前端·人工智能·python