端到端自动驾驶的基础概念

欢迎大家关注我的B站:

偷吃薯片的Zheng同学的个人空间-偷吃薯片的Zheng同学个人主页-哔哩哔哩视频 (bilibili.com)

目录

1.端到端自动驾驶的定义

1.1特斯拉FSD

1.2端到端架构演进

1.3大模型

1.4世界模型

1.5纯视觉传感器

2.落地的挑战


1.端到端自动驾驶的定义

端到端自动驾驶也就是end-to-end autonomous driving(下面用端到端 代替)的早期定义是"从传感器输入到控制输出的单一神经网络模型 ",现阶段端到端 的定义是"感知信息无损传递,自动驾驶系统的全局优化"

1.1特斯拉FSD

虽然在特斯拉FSD 宣布切换至端到端技术架构后,国内智能驾驶公司也纷纷推出各种端到端智驾系统,但是技术主义者往往会认为这并不是真正的端到端,其实这些争议也来源于对于端到端的定义不清晰。

1.2端到端架构演进

  • 第一阶段:感知端到端。通过多传感器融合的数据输入,最后表征成BEV范式,已经是目前非常常见的感知方案。
  • 第二阶段:决策规划端到端。预测到决策到规划都是通过深度学习,集成到一个神经网络中去训练学习。虽然都是神经网络但是每个模型的训练优化局限在模块内部,传递会有信息损失。
  • 第三阶段:模块化端到端。这一阶段主要是感知和决策规划之间不再是人类理解的结果,而是特征向量,也就是两个模块不能独立训练,而支持跨模块的梯度传导。
  • 第四阶段:One Model。这时候网络的内部也不再有明确的划分。

1.3大模型

端到端不等同于大模型,大模型更关注模型的参数量以及智能涌现能力 ,而端到端强调结构上的梯度可传导以及全局优化。所以大模型为端到端提供了很好的可选方案,但是端到端并非必然用大模型实现。

自动驾驶目前的大模型由于车端算力以及实时性 的影响,很难达到NLP领域的标准 ,只是比自动驾驶感知领域 的参数量大的多而已。但是LLM仍旧是为了智驾的趋势,因为其强大的推理能力和可解释性 有望解决决策规划领域各种corner case

1.4世界模型

世界模型是指能够学习以及揭示真实物理世界及数学定律的模型。世界模型是自动驾驶开发中数据生成器的角色,他可以源源不断生成数据 ,并且覆盖大量车无法采集到的极端工况 ,对长尾问题很有帮助,并且在线生成的成本优势很大。

世界模型自身具备理解周围环境以及交互情况 ,因此只需要调整或增加一些输出链路或模块就可实现端到端。但短期内制约这种方案的难点是车端算力 不够,后续会考虑蒸馏 或其他方式在保持对真实世界理解的能力下最大程度裁剪模型。

1.5纯视觉传感器

有些从业者认为端到端一定只能基于纯视觉,这个误解源于BEV范式成为业界主流,但是多传感器的选择和融合只是模型的输入,哪些传感器能让端到端自动驾驶效果更好并没有大量的实验去验证出来。

2.落地的挑战

  • 技术路线:还未形成,各个企业之间存在分歧
  • 数据:数据量、数据标注、数据质量和数据分布都是影响training的关键因素
  • 算力:算力要求高
  • 测试技术:行业需要新的测试验证方法论和工具链,目前有很多关于自动驾驶测试场景生成等等研究
  • 产业:端到端需要上游工具链、芯片等产业加速进步
相关推荐
Abdullah al-Sa8 分钟前
Docker教程(喂饭级!)
c++·人工智能·docker·容器
神经星星11 分钟前
无机材料逆合成效率飙升,韩国团队推出Retrieval-Retro,成果入选NeurIPS 2024
人工智能·深度学习·机器学习
大数据追光猿15 分钟前
【深度学习】Pytorch项目实战-基于协同过滤实现物品推荐系统
人工智能·pytorch·python·深度学习·ai编程·推荐算法
CodeJourney.24 分钟前
EndNote与Word关联:科研写作的高效助力
数据库·人工智能·算法·架构
jingwang-cs31 分钟前
内外网文件传输 安全、可控、便捷的跨网数据传输方案
人工智能·后端·安全
乐享数科44 分钟前
乐享数科:供应链金融—三个不同阶段的融资模式
大数据·人工智能·金融
幻想趾于现实1 小时前
视觉应用工程师(面试)
人工智能·数码相机·计算机视觉
简简单单做算法1 小时前
基于PSO粒子群优化的BiLSTM双向长短期记忆网络序列预测算法matlab仿真,对比BiLSTM和LSTM
人工智能·lstm·bilstm·pso-bilstm·pso·双向长短期记忆网络·序列预测
Felaim2 小时前
基于模仿学习(IL)的端到端自动驾驶发展路径
人工智能·深度学习·自动驾驶
量子-Alex2 小时前
【目标检测】【PANet】Path Aggregation Network for Instance Segmentation
人工智能·目标检测·计算机视觉