自动驾驶核心技术

自动驾驶核心技术

自动驾驶等级划分

  • L0:无自动化
  • L1:原始驾驶员辅助系统,像自适应巡航、防抱死制动
  • L2::部分自动化,像紧急制动、车道保持、碰撞预警
  • L3:有条件的全自动化,在正常操作期间,驾驶员可以专注于除驾驶以外的其他任务,紧急情况需要快速响应接管车辆(目前国产自动化驾驶)
  • L4:在天气条件许可,基础设施完善的情况下,完全不需要驾驶员
  • L5:无论在任何场景下,都不需要驾驶员,目前尚无实现L4级别及以上的自动驾驶车辆

自动驾驶经典架构-感知层、决策规划层、控制层

我理解自动驾驶架构离不开算法的加持,感知层使用感知识别算法 ,决策规划层使用自主定位、规划决策算法 ,控制层使用自主控制算法

感知层

传感器(摄像头、雷达、激光雷达)提供了原始数据流 ,但这些数据本身只是一堆像素点、一簇距离点或一组电磁波信号。感知识别算法的任务,就是像人类大脑一样,从这些数据中提取出有意义的、结构化的信息。(识别过程中必不可少的应该就是数据集,这些数据集由数据标注而来)

常见的传感器:

  1. 摄像头
  • 原理:模仿人眼,通过CMOS/CCD采集光线,形成2D图像。
  • 优势:分辨率高,能识别颜色、纹理、文字(交通标志)、信号灯状态,成本相对较低。
  • 劣势:受光照(逆光、夜间)、天气(雨雾)影响极大;获取的是2D信息,测距不精准。
  • 原理:通过卷积神经网络提取图像特征 → 生成可能包含物体的候选框 → 对候选框进行分类和位置精修。
  1. 激光雷达
  • 原理 :主动发射激光束,测量反射时间,生成周围环境的高精度三维点云
  • 优势:测距精度极高(厘米级),能生成真实3D模型,不受光照影响。
  • 劣势:成本高昂;在极端雨雪、浓雾天气性能下降;难以识别颜色和纹理信息。
  1. 毫米波雷达
  • 原理 :发射无线电波,利用多普勒效应探测物体的距离和相对速度
  • 优势:测速极准;穿透性强,基本不受雨、雾、灰尘影响;探测距离远。
  • 劣势:分辨率低,无法识别物体细节和形状。

多传感器融合解决了单一传感器的根本局限:

  • 摄像头 :能识别"是什么 ",但不知"有多远"。
  • 激光雷达 :能测量"在哪里、多精确 ",但不知"是什么"。
  • 毫米波雷达 :能知道"有东西在动、多快 ",但不知其具体身份
  • 融合后 :形成 "前方15.3米处有一个静止的停止标志" 的完整、可靠环境认知。

核心传感器特性对比表

传感器 探测维度 测距精度 测速能力 恶劣天气适应性 成本 关键信息
摄像头 2D图像 低(依赖估算) 颜色、纹理、语义
激光雷达 3D点云 极高(厘米级) 中(受大雨雪影响) 极高 精确3D轮廓、距离
毫米波雷达 距离、速度 极高 极好 距离、速度(尤其径向)
决策规划层

如果说感知层是"看清世界",决策规划层就是"思考如何行动"。它首先需要确切地知道 "我在哪里"(自主定位) ,然后才能决定 "要去哪、怎么走" ,最终规划出具体、平滑的行驶路线。

决策规划层可以细分为三个核心阶段:定位、决策、规划。它们环环相扣。

阶段 核心问题 关键技术/算法 作用与输出
1. 自主定位 "我在哪里?" GNSS/RTKSLAM、惯性导航、高精地图匹配 确定车辆在全局坐标系中的厘米级精确位姿(位置、朝向)。
2. 行为决策 "现在该干什么?" 基于规则/状态机、博弈论、深度强化学习 根据定位、感知信息,输出高层驾驶策略指令,如:跟车、变道、超车、停车。
3. 运动规划 "具体该怎么走?" 路径搜索(A*)轨迹优化(MPC) 将决策指令转化为一条平滑、安全、可执行的具体轨迹(未来几秒内每个时刻的位置、速度)。

核心任务分解:

  1. 全局路径规划(路由) :规划从A点到B点的最优宏观路线 ,类似手机导航。(核心算法:A*算法、Dijkstra算法)。
  2. 行为决策 :根据实时路况(周围车、人、规则),决策驾驶策略,如:跟车、变道、超车、让行。(实现方法:基于规则、基于学习/强化学习)。
  3. 运动规划 :将行为决策转化为一条平滑、安全、可执行的具体轨迹 (未来几秒内每个时刻的位置、速度)。(主流方法:模型预测控制,即"走一步,看三步")。

特点与挑战:

  • 拟人化:需要像人一样预判他车意图,进行安全博弈。
  • 安全性 :必须处理罕见但危险的"长尾场景"(如突然滚出的轮胎)。
  • 舒适性:规划的轨迹需平顺,避免急刹、猛拐。
控制层

控制层是系统的"手脚 ",它接收规划层下发的"理想轨迹 ",通过精确调节方向盘转角、油门和刹车,让车辆稳定、精准地沿着这条轨迹行驶

核心控制任务:

  1. 横向控制 :控制方向盘,使车辆准确跟踪期望的行驶路径(如保持车道、过弯)。
  2. 纵向控制 :控制油门和刹车,使车辆达到并保持期望的速度,同时与前车保持安全距离。

核心技术:

  • PID控制
    • 核心思想基于当前误差进行即时反应。就像你用手保持木棍直立,眼睛看到棍子往哪边倒(误差),手就立刻往反方向调整。
    • 工作原理
      • P(比例):误差越大,调整力度越大。(倒得越厉害,手推得越用力)
      • I(积分):消除历史累计的稳态误差。(如果一直有一个小角度的偏差,就慢慢加大力度修正它)
      • D(微分):预测误差变化趋势,抑制振荡。(看到棍子倒得越来越快,就提前加大力度"刹车")
    • 在自动驾驶中的应用
      • 优点:简单、稳定、计算量小,广泛应用于基础巡航控制。
      • 缺点 :像是"近视眼",只关心当前瞬间的误差,无法提前预见未来变化,也难以处理复杂的车辆动力学耦合(如高速过弯时,横向和纵向控制会互相影响)。
  • 模型预测控制
    • 核心思想滚动优化,反馈校正 。这是目前高阶自动驾驶的主流和前沿
    • 工作原理(四步循环)
      1. 预测 :基于车辆动力学模型和当前状态,预测未来一段时域内多条可能的轨迹。
      2. 优化 :从这些轨迹中,选择一条综合成本最低的(成本函数考虑:跟踪精度、乘坐舒适、能耗、安全性等)。
      3. 执行 :只将这条最优轨迹的第一步控制指令发送给执行器。
      4. 滚动 :下一时刻,基于新的实际车辆状态,重新开始预测-优化-执行的循环。
    • 在自动驾驶中的绝对优势
      • 预见性:能提前考虑未来路径曲率变化、限速变化等,做出更平顺的决策。
      • 处理约束:能直接将物理限制(如方向盘转角极限、轮胎摩擦圆)作为优化问题的约束,保证控制指令永远可行、安全。
      • 多目标协同:天然地将横向和纵向控制统一在一个优化框架内处理,实现更好的协同。

执行基础:线控底盘

  • 是什么 :传统汽车的油门、刹车、方向盘通过机械/液压与驾驶员相连。线控底盘 则将其改为电子信号控制,为自动驾驶的指令执行提供了直接的物理接口。
  • 重要性:没有线控底盘,自动驾驶的"大脑"就无法直接"指挥"车辆行动。

技术架构总结

架构层级 核心比喻 输入 核心任务/算法 输出
感知层 眼睛与耳朵 传感器原始数据 感知识别、多传感器融合 环境结构化模型(目标、车道、信号灯)
决策规划层 AI老司机(大脑) 环境模型、目的地 路径搜索(A*)、行为决策、轨迹规划(MPC) 一条平滑、安全的未来行驶轨迹
控制层 精准的手脚 期望轨迹、车辆状态 横向/纵向控制(PID, MPC) 方向盘转角、油门/刹车开度
执行层 强健的躯体 控制指令 线控底盘执行 车辆的实际运动

关键闭环:数据驱动的迭代

整个系统运行中产生的数据(尤其是感知错误、规划不足的**"Corner Cases")会被收集、标注,用于 重新训练和优化算法模型**,形成"数据闭环",驱动系统持续进化。

相关推荐
Juicedata3 小时前
JuiceFS 企业版 5.3 特性详解:单文件系统支持超 5,000 亿文件,首次引入 RDMA
大数据·人工智能·机器学习·性能优化·开源
Piar1231sdafa3 小时前
蓝莓目标检测——改进YOLO11-C2TSSA-DYT-Mona模型实现
人工智能·目标检测·计算机视觉
愚公搬代码3 小时前
【愚公系列】《AI短视频创作一本通》002-AI引爆短视频创作革命(短视频创作者必备的能力)
人工智能
数据猿视觉3 小时前
新品上市|奢音S5耳夹耳机:3.5g无感佩戴,178.8元全场景适配
人工智能
蚁巡信息巡查系统3 小时前
网站信息发布再巡查机制怎么建立?
大数据·人工智能·数据挖掘·内容运营
AI浩3 小时前
C-RADIOv4(技术报告)
人工智能·目标检测
Purple Coder3 小时前
AI赋予超导材料预测论文初稿
人工智能
Data_Journal3 小时前
Scrapy vs. Crawlee —— 哪个更好?!
运维·人工智能·爬虫·媒体·社媒营销
云边云科技_云网融合3 小时前
AIoT智能物联网平台:架构解析与边缘应用新图景
大数据·网络·人工智能·安全
码农水水3 小时前
得物Java面试被问:消息队列的死信队列和重试机制
java·开发语言·jvm·数据结构·机器学习·面试·职场和发展