【百度Apollo】探索自动驾驶:百度Apollo视觉感知模块的实践与创新


🎬 鸽芷咕个人主页
🔥 个人专栏 : 《linux深造日志》《粉丝福利》

⛺️生活的理想,就是为了理想的生活!


文章目录

引入

随着自动驾驶技术的不断发展,视觉感知作为自动驾驶系统中的关键模块之一,在实现车辆环境感知和决策中发挥着重要作用。百度Apollo自动驾驶平台的视觉感知模块为自动驾驶车辆提供了强大的感知和理解能力,本文将探讨百度Apollo视觉感知模块的实践应用及其在自动驾驶领域的意义。

一、百度Apollo视觉感知模块概述

百度Apollo视觉感知模块是基于深度学习技术构建的模块,能够从车载摄像头等传感器获取的图像数据中提取关键信息,包括道路、车辆、行人等目标的检测与识别,路况的理解与预测等。它能够实时高效地感知车辆周围的环境,为自动驾驶系统的决策和控制提供重要支持。

二、启动感知模块

步骤一:进入 Docker 环境并启动 Dreamview

  1. 进入 Apollo Docker 环境。

    复制代码
    ./apollo.sh
  2. 在 Docker 环境里,启动 Dreamview。

    复制代码
    ./scripts/bootstrap.sh

    如果需要关闭 Dreamview,请您执行以下命令:

    复制代码
    ./scripts/bootstrap.sh stop

步骤二:选择车型和地图

  1. 在浏览器输入网址 http://localhost:8888/,打开 Dreamview。

  2. 选择车型和地图。

    • 在 Dreamview 右上角的 --vehicle-- 中,选择 mkz_example
    • 在 Dreamview 右上角的 --map-- 中,选择 Sunnyvale Big Loop

    车辆选择后,程序会把会把 calibration/data 目录下对应的车型参数和传感器内外参文件拷贝到作用目录下。地图选择后在 Dreamview 下便可以正常显示当前地图。

步骤三:启动所需模块

  1. 在 Dreamview 上打开 Transform 按钮。

    您也可以在终端执行如下命令:

    复制代码
    cyber_launch start /apollo/modules/transform/launch/static_transform.launch

    Transform 模块为了发布传感器各坐标系变换供各模块调用。

  2. 启动 image decompression 模块。

    复制代码
    cyber_launch start modules/drivers/tools/image_decompress/launch/image_decompress.launch

    视觉模块依赖的输入是相机传感器采集到的图像数据,image decompression 模块可以将压缩的图像数据解压缩。

步骤四:启动视觉感知模块

启动红绿灯检测模块

复制代码
cyber_launch start /apollo/modules/perception/production/launch/perception_trafficlight.launch

启动视觉障碍物检测模块

复制代码
mainboard -d modules/perception/production/dag/dag_streaming_perception_camera.dag

这个命令会同时开启视觉障碍物检测和车道线检测,在启动时终端可能出现一些红色的警告提示,只要进程不退出都是正常现象,模型可以正常启动。

视觉感知模块启动需要一些时间,您可以通过下面两种方法判断是否启动完毕:

  • 在终端执行如下命令,查看 GPU 的占用情况:

    复制代码
      watch -n 0.1 nvidia-smi

    当 mainboard 进程显存占用不再变化,证明模型已经完成启动。

  • 在 Docker 环境下,执行如下命令:

    复制代码
     tail -f /apollo/data/log/mainboard.INFO

    该命令表示实时显示 cyber 日志的尾部。当屏幕中该日志显示如下信息时,则可以确定感知模块已启动完毕。

(可选)单独启动车道线检测模块

复制代码
mainboard -d ./modules/perception/production/dag/dag_streaming_perception_lane.dag

三、在 Dreamview 上可视化检测结果

视觉障碍物主要检测远处(>50m)的障碍物。视觉障碍物感知结果不单独输出,而是跟激光雷达的检测结果融合后输出。为了让您直观地感受 Apollo 视觉感知模块的输出,本文档把视觉感知的结果单独输出。完成视觉感知实践操作后,要将 channel 的修改复原,以免影响雷达感知的输出。

在 Dreamview 上查看视觉感知的检测结果,请您按照以下步骤对配置文件进行修改:

步骤一:下载并解压数据包

数据包里存放了我们路测时采集的数据,包括定位、感知、预测规划等模块的信息。我们提供了测试数据包 demo_sensor_data_for_vision.tar.xz 供开发者进行测试。

复制代码
   wget https://apollo-system.cdn.bcebos.com/dataset/6.0_edu/demo_sensor_data_for_vision.tar.xz

   tar -xvf demo_sensor_data_for_vision.tar.xz

步骤二:将数据包复制指定目录

为了在 Docker 中可以访问 record,将下载的数据包复制到 /apollo/data/bag 目录下。

步骤三:进入 Docker 环境并启动 Dreamview

  1. 进入 Apollo Docker 环境。

    复制代码
    ./apollo.sh
  2. 在 Docker 环境里,启动 Dreamview。

    复制代码
    ./scripts/bootstrap.sh

    注意:再次启动 Dreamview 前,请您先关闭 Dreamview。

步骤四:选择车型和地图

  1. 在浏览器输入网址 http://localhost:8888/,打开 Dreamview。

  2. 选择车型和地图。

    • 在 Dreamview 右上角的 --vehicle-- 中,选择 mkz_example
    • 在 Dreamview 右上角的 --map-- 中,选择 Sunnyvale Big Loop

    车辆选择后,程序会把会把 calibration/data 目录下对应的车型参数和传感器内外参文件拷贝到作用目录下。地图选择后在 Dreamview 下便可以正常显示当前地图。

步骤五:启动所需模块

  1. 在 Dreamview 上打开 Transform 按钮。

    您也可以在终端执行如下命令:

    复制代码
    cyber_launch start /apollo/modules/transform/launch/static_transform.launch

    Transform 模块为了发布传感器各坐标系变换供各模块调用。

  2. 启动 image decompression 模块。

    复制代码
    cyber_launch start modules/drivers/tools/image_decompress/launch/image_decompress.launch

    视觉模块依赖的输入是相机传感器采集到的图像数据,image decompression 模块可以将压缩的图像数据解压缩。

步骤六:修改输出的 channel 名称

视觉障碍物检测默认的输出 channel 为 /perception/obstacles,不会在 Dreamview 上显示检测结果。如果想要在 Dreamview 上可视化结果,需要修改下面文件的一部分关键字。

  1. 打开文件。

    vim modules/perception/production/conf/perception/camera/fusion_camera_detection_component.pb.txt

  2. 定位到第 10 行,修改为:

    复制代码
    output_final_obstacles : true
  3. 定位到第 11 行,修改为:

    复制代码
    output_obstacles_channel_name : "/apollo/perception/obstacles"

    注意:请您修改完 channel 信息之后,再启动障碍物检测模块。否则会检测不到障碍物。

步骤七:启动视觉障碍物检测模块

复制代码
mainboard -d modules/perception/production/dag/dag_streaming_perception_camera.dag

注意:成功启动的判定标准是观察处理器的显存不再发生变化或者 cyber 日志尾部输出结束信息。

步骤八:播放数据包

等到感知模块成功启动后,执行如下命令:

复制代码
cyber_recorder play -f /apollo/data/bag/demo_sensor_data_for_vision.record -k /apollo/perception/obstacles /apollo/prediction

如果在 Dreamview 可以看到障碍物,说明模块启动成功,如下图所示。图中的绿色框便是我们的视觉感知算法检测出的障碍物。

完成视觉感知实践操作后,要将 channel 的修改复原,以免影响雷达感知的输出。

相关推荐
触底反弹2 分钟前
🔥 从点积到 Transformer:我终于搞懂大模型是怎么"猜"出下一个词的了
人工智能·机器学习·架构
Token炼金师6 分钟前
算力显存通信的三角博弈:DP/TP/PP/SP、ZeRO、混合精度与稳定性 —— 训练优化四件套
人工智能·深度学习·dp·sp·pp·zero·tp
无糖可可果8 分钟前
MCP(Model Context Protocol)学习分享:从理论到实践
人工智能
RFID科技的魅力9 分钟前
RFID资产管理系统选型避坑指南:从需求梳理到落地验证
大数据·人工智能·物联网·rfid
ai产品老杨21 分钟前
【边云协同视频分析项目实战记录】多站点AI视频分析平台部署手册
人工智能·音视频
北鹤M24 分钟前
如何将模特导入AI实现电商智能换装,主流工具体验分享
人工智能·aigc
一知半解仙31 分钟前
2026年彻底免费的辅助编程Agent大模型汇总
开发语言·人工智能·开源
2301_7671139832 分钟前
Ollama 本地部署与运维使用指南
人工智能·ollama
2501_911067661 小时前
乡村振兴 + 零碳民生稿:叁仟光伏智慧灯杆,点亮杭州共富乡村绿色数字路
人工智能·5g·重构·生活·智慧城市
地平线开发者1 小时前
征程 6E/M Matrix 开发评板使用系列(一):开箱与点亮
算法·自动驾驶