【百度Apollo】探索自动驾驶:百度Apollo视觉感知模块的实践与创新


🎬 鸽芷咕个人主页
🔥 个人专栏 : 《linux深造日志》《粉丝福利》

⛺️生活的理想,就是为了理想的生活!


文章目录

引入

随着自动驾驶技术的不断发展,视觉感知作为自动驾驶系统中的关键模块之一,在实现车辆环境感知和决策中发挥着重要作用。百度Apollo自动驾驶平台的视觉感知模块为自动驾驶车辆提供了强大的感知和理解能力,本文将探讨百度Apollo视觉感知模块的实践应用及其在自动驾驶领域的意义。

一、百度Apollo视觉感知模块概述

百度Apollo视觉感知模块是基于深度学习技术构建的模块,能够从车载摄像头等传感器获取的图像数据中提取关键信息,包括道路、车辆、行人等目标的检测与识别,路况的理解与预测等。它能够实时高效地感知车辆周围的环境,为自动驾驶系统的决策和控制提供重要支持。

二、启动感知模块

步骤一:进入 Docker 环境并启动 Dreamview

  1. 进入 Apollo Docker 环境。

    复制代码
    ./apollo.sh
  2. 在 Docker 环境里,启动 Dreamview。

    复制代码
    ./scripts/bootstrap.sh

    如果需要关闭 Dreamview,请您执行以下命令:

    复制代码
    ./scripts/bootstrap.sh stop

步骤二:选择车型和地图

  1. 在浏览器输入网址 http://localhost:8888/,打开 Dreamview。

  2. 选择车型和地图。

    • 在 Dreamview 右上角的 --vehicle-- 中,选择 mkz_example
    • 在 Dreamview 右上角的 --map-- 中,选择 Sunnyvale Big Loop

    车辆选择后,程序会把会把 calibration/data 目录下对应的车型参数和传感器内外参文件拷贝到作用目录下。地图选择后在 Dreamview 下便可以正常显示当前地图。

步骤三:启动所需模块

  1. 在 Dreamview 上打开 Transform 按钮。

    您也可以在终端执行如下命令:

    复制代码
    cyber_launch start /apollo/modules/transform/launch/static_transform.launch

    Transform 模块为了发布传感器各坐标系变换供各模块调用。

  2. 启动 image decompression 模块。

    复制代码
    cyber_launch start modules/drivers/tools/image_decompress/launch/image_decompress.launch

    视觉模块依赖的输入是相机传感器采集到的图像数据,image decompression 模块可以将压缩的图像数据解压缩。

步骤四:启动视觉感知模块

启动红绿灯检测模块

复制代码
cyber_launch start /apollo/modules/perception/production/launch/perception_trafficlight.launch

启动视觉障碍物检测模块

复制代码
mainboard -d modules/perception/production/dag/dag_streaming_perception_camera.dag

这个命令会同时开启视觉障碍物检测和车道线检测,在启动时终端可能出现一些红色的警告提示,只要进程不退出都是正常现象,模型可以正常启动。

视觉感知模块启动需要一些时间,您可以通过下面两种方法判断是否启动完毕:

  • 在终端执行如下命令,查看 GPU 的占用情况:

    复制代码
      watch -n 0.1 nvidia-smi

    当 mainboard 进程显存占用不再变化,证明模型已经完成启动。

  • 在 Docker 环境下,执行如下命令:

    复制代码
     tail -f /apollo/data/log/mainboard.INFO

    该命令表示实时显示 cyber 日志的尾部。当屏幕中该日志显示如下信息时,则可以确定感知模块已启动完毕。

(可选)单独启动车道线检测模块

复制代码
mainboard -d ./modules/perception/production/dag/dag_streaming_perception_lane.dag

三、在 Dreamview 上可视化检测结果

视觉障碍物主要检测远处(>50m)的障碍物。视觉障碍物感知结果不单独输出,而是跟激光雷达的检测结果融合后输出。为了让您直观地感受 Apollo 视觉感知模块的输出,本文档把视觉感知的结果单独输出。完成视觉感知实践操作后,要将 channel 的修改复原,以免影响雷达感知的输出。

在 Dreamview 上查看视觉感知的检测结果,请您按照以下步骤对配置文件进行修改:

步骤一:下载并解压数据包

数据包里存放了我们路测时采集的数据,包括定位、感知、预测规划等模块的信息。我们提供了测试数据包 demo_sensor_data_for_vision.tar.xz 供开发者进行测试。

复制代码
   wget https://apollo-system.cdn.bcebos.com/dataset/6.0_edu/demo_sensor_data_for_vision.tar.xz

   tar -xvf demo_sensor_data_for_vision.tar.xz

步骤二:将数据包复制指定目录

为了在 Docker 中可以访问 record,将下载的数据包复制到 /apollo/data/bag 目录下。

步骤三:进入 Docker 环境并启动 Dreamview

  1. 进入 Apollo Docker 环境。

    复制代码
    ./apollo.sh
  2. 在 Docker 环境里,启动 Dreamview。

    复制代码
    ./scripts/bootstrap.sh

    注意:再次启动 Dreamview 前,请您先关闭 Dreamview。

步骤四:选择车型和地图

  1. 在浏览器输入网址 http://localhost:8888/,打开 Dreamview。

  2. 选择车型和地图。

    • 在 Dreamview 右上角的 --vehicle-- 中,选择 mkz_example
    • 在 Dreamview 右上角的 --map-- 中,选择 Sunnyvale Big Loop

    车辆选择后,程序会把会把 calibration/data 目录下对应的车型参数和传感器内外参文件拷贝到作用目录下。地图选择后在 Dreamview 下便可以正常显示当前地图。

步骤五:启动所需模块

  1. 在 Dreamview 上打开 Transform 按钮。

    您也可以在终端执行如下命令:

    复制代码
    cyber_launch start /apollo/modules/transform/launch/static_transform.launch

    Transform 模块为了发布传感器各坐标系变换供各模块调用。

  2. 启动 image decompression 模块。

    复制代码
    cyber_launch start modules/drivers/tools/image_decompress/launch/image_decompress.launch

    视觉模块依赖的输入是相机传感器采集到的图像数据,image decompression 模块可以将压缩的图像数据解压缩。

步骤六:修改输出的 channel 名称

视觉障碍物检测默认的输出 channel 为 /perception/obstacles,不会在 Dreamview 上显示检测结果。如果想要在 Dreamview 上可视化结果,需要修改下面文件的一部分关键字。

  1. 打开文件。

    vim modules/perception/production/conf/perception/camera/fusion_camera_detection_component.pb.txt

  2. 定位到第 10 行,修改为:

    复制代码
    output_final_obstacles : true
  3. 定位到第 11 行,修改为:

    复制代码
    output_obstacles_channel_name : "/apollo/perception/obstacles"

    注意:请您修改完 channel 信息之后,再启动障碍物检测模块。否则会检测不到障碍物。

步骤七:启动视觉障碍物检测模块

复制代码
mainboard -d modules/perception/production/dag/dag_streaming_perception_camera.dag

注意:成功启动的判定标准是观察处理器的显存不再发生变化或者 cyber 日志尾部输出结束信息。

步骤八:播放数据包

等到感知模块成功启动后,执行如下命令:

复制代码
cyber_recorder play -f /apollo/data/bag/demo_sensor_data_for_vision.record -k /apollo/perception/obstacles /apollo/prediction

如果在 Dreamview 可以看到障碍物,说明模块启动成功,如下图所示。图中的绿色框便是我们的视觉感知算法检测出的障碍物。

完成视觉感知实践操作后,要将 channel 的修改复原,以免影响雷达感知的输出。

相关推荐
云卓SKYDROID11 分钟前
无人机避障与目标识别技术分析!
人工智能·无人机·科普·高科技·云卓科技·激光避障
chuangfumao18 分钟前
解读《人工智能指数报告 2025》:洞察 AI 发展新态势
人工智能·搜索引擎·百度
可爱の小公举29 分钟前
自然语言处理(NLP)领域大图
人工智能·自然语言处理
qq_436962181 小时前
AI数据分析的优势分析
人工智能·数据挖掘·数据分析
Vodka~1 小时前
深度学习——数据处理脚本(基于detectron2框架)
人工智能·windows·深度学习
爱的叹息1 小时前
关于 传感器 的详细解析,涵盖定义、分类、工作原理、常见类型、应用领域、技术挑战及未来趋势,结合实例帮助理解其核心概念
人工智能·机器人
恶霸不委屈1 小时前
突破精度极限!基于DeepSeek的无人机航拍图像智能校准系统技术解析
人工智能·python·无人机·deepseek
lixy5792 小时前
深度学习之自动微分
人工智能·python·深度学习
量子位2 小时前
飞猪 AI 意外出圈!邀请码被黄牛倒卖,分分钟搞定机酒预订,堪比专业定制团队
人工智能·llm·aigc