端到端自动驾驶

自动驾驶主要流程:感知->预测->规划

预测是预测周围目标(车、行人、动物等)的轨迹,规划是规划自车的运动轨迹。

UniAD[CVPR 2023]:

使用transformer架构,统一自动驾驶流程 ,完成所有检测,跟踪,建图,轨迹预测,占据栅格预测与规划的端到端推理。

参考:

CVPR 2023 Award Candidate | 自动驾驶通用算法框架UniAD - OpenGVLab的文章 - 知乎

https://zhuanlan.zhihu.com/p/616433397

VAD[ICCV2023]:

核心在于场景表征使用矢量化 的方式,非图像常用的栅格化。好处就是可以加快推理。

【「你好,开发者」 ICCV 2023 VAD 基于矢量化环境表征的高效端到端自动驾驶框架】 https://www.bilibili.com/video/BV12u4y1V7zV/?share_source=copy_web

FusionAD

基于BEV统一相机和雷达多模态输入 。task使用类似FPN的层级结构。

https://hub.baai.ac.cn/view/28712

Tesla FSD V12

AD-MLP

仅仅使用了传感器数据,利用简单的mlp网络,就在nuscene plan数据集上得到了很好的效果。说明nuscene plan数据集过于简单,仅在这个上面做开环测试不能很好的说明问题,需要引入其他的如仿真环境中做更多的闭环测试。

参考:

端到端自动驾驶算法在 nuScenes 数据集上的开环评测或许并不靠谱 - Muyun99的文章 - 知乎

https://zhuanlan.zhihu.com/p/654533840

相关推荐
爱写代码的小朋友13 小时前
人工智能驱动下个性化学习路径的构建与实践研究——以K12数学学科为例
人工智能·学习
宝贝儿好15 小时前
【强化学习实战】第十一章:Gymnasium库的介绍和使用(1)、出租车游戏代码详解(Sarsa & Q learning)
人工智能·python·深度学习·算法·游戏·机器学习
绝世这天下17 小时前
【在 DGX Spark 上运行 vLLM-Omni 用于 Qwen3-TTS(语音设计,语音克隆)】
人工智能
陈大鱼头18 小时前
[译]费尽心思来保障 OpenClaw ?那跟直接用 GPT 有什么区别?
人工智能
Fleshy数模18 小时前
玩转OpenCV:视频椒盐噪声处理与图像形态学操作实战
人工智能·opencv·音视频
幂律智能18 小时前
Agent × 流程引擎融合架构:从静态流程到智能流程编排
人工智能·架构·agent
无垠的广袤18 小时前
ChatECNU 大语言模型与 PicoClaw 部署
人工智能·语言模型·自然语言处理·嵌入式·树莓派
爱淋雨的男人19 小时前
自动驾驶感知相关算法
人工智能·算法·自动驾驶
互联网科技看点19 小时前
AI算力爆发叠加数据资产风口,铂拉锐科技布局去中心化数字生态
人工智能·科技·去中心化
如若12319 小时前
flash-attn 安装失败?从报错到成功的完整排雷指南(CUDA 12.8 + PyTorch 2.7)
人工智能·pytorch·python