端到端自动驾驶

自动驾驶主要流程:感知->预测->规划

预测是预测周围目标(车、行人、动物等)的轨迹,规划是规划自车的运动轨迹。

UniADCVPR 2023:

使用transformer架构,统一自动驾驶流程 ,完成所有检测,跟踪,建图,轨迹预测,占据栅格预测与规划的端到端推理。

参考:

CVPR 2023 Award Candidate | 自动驾驶通用算法框架UniAD - OpenGVLab的文章 - 知乎

https://zhuanlan.zhihu.com/p/616433397

VADICCV2023:

核心在于场景表征使用矢量化 的方式,非图像常用的栅格化。好处就是可以加快推理。

【「你好,开发者」 ICCV 2023 VAD 基于矢量化环境表征的高效端到端自动驾驶框架】 https://www.bilibili.com/video/BV12u4y1V7zV/?share_source=copy_web

FusionAD

基于BEV统一相机和雷达多模态输入 。task使用类似FPN的层级结构。

https://hub.baai.ac.cn/view/28712

Tesla FSD V12

AD-MLP

仅仅使用了传感器数据,利用简单的mlp网络,就在nuscene plan数据集上得到了很好的效果。说明nuscene plan数据集过于简单,仅在这个上面做开环测试不能很好的说明问题,需要引入其他的如仿真环境中做更多的闭环测试。

参考:

端到端自动驾驶算法在 nuScenes 数据集上的开环评测或许并不靠谱 - Muyun99的文章 - 知乎

https://zhuanlan.zhihu.com/p/654533840

相关推荐
100个铜锣烧3 小时前
高级提示技术:Chain-of-Thought与ReAct——让大模型学会“思考”和“行动”
人工智能·大模型·提示词工程
JackHCC4 小时前
快手OneRetrieval:可编辑生成式电商召回
人工智能·机器学习
前端之虎陈随易4 小时前
编程语言级别的Skill市场,AI Agent 的未来形态
前端·vue.js·人工智能·typescript·node.js
QiLinkOS4 小时前
第三视觉理解徐玉生与他的商业活动(30)
大数据·c++·人工智能·算法·开源协议
武汉唯众智创4 小时前
当汉字成为心理CT:AI汉字联想投射分析的技术实现与心理评估价值
人工智能·ai心理健康·ai心理评估·本土化心理测评·校园心理健康解决方案·ai心理监测·多模态情绪模型
Longvox5 小时前
Agent为什么会死循环?
人工智能·ai编程
陈天伟教授5 小时前
FreeCAD 启动后小窗口闪现即退的解决思路
人工智能·机器人·工业设计
酒旅Agent开发实战5 小时前
AI 旅行规划助手如何接入真实酒旅数据:从自然语言到酒店预订的全流程 MCP 实战
人工智能·ai·旅游·skill·酒店api·机票api
workflower5 小时前
设备单元级(L1)实施路径
人工智能·线性代数·矩阵·机器人·开源
Dragon Wu5 小时前
ComfyUI Desktop 实例进入后一直loading的问题解决
人工智能·ai