MARS: An Instance-aware, Modular and Realistic Simulator for Autonomous Driving

1. 摘要

  • 逼真的传感器仿真解决剩余corner case
  • 3个工作
    • 1.实例意识。作者的仿真器用独立的网络分别仿真前台实例和后台环境,以便可以分别控制实例的静态(例如大小和外观)和动态(例如轨迹)属性
    • 2.模块化。作者的仿真器允许在不同的现代NeRF相关主干、采样策略、输入模式等之间灵活切换。希望这种模块化设计能促进给予NeRF的自动驾驶方针的学术进步和工业部署
    • 3.现实。作者的仿真器设置了新的最先进的照片现实主义的结果给出了最佳的模块选择。

2. Nerf最新进展

2.1. Nerf:将场景表达为3D空间的场

  • https://arxiv.org/pdf/2003.08934.pdf

  • 基本思想:3维空间,3D点都向外发射,并且具有一定的体积,可以阻挡其他方向的射线传播

  • 将位置和观察角度 ( x , y , z , θ , ϕ ) (x,y,z,\theta,\phi) (x,y,z,θ,ϕ)转化为 ( R , G , B , δ ) (R,G,B,\delta) (R,G,B,δ),RGB和反射率

  • 渲染出每个点的Color(RGB)+Density(阻挡能力),用渲染的颜色和原图颜色做loss

  • Blend weights:通过前面所有不透明度的积分得到当前点的积分

  • 体渲染:将所有点从近到远排列到一块,利用Blend weights和积分得到当前点的渲染颜色

  • 真实实现Nerf不用积分,计算量大

  • Nerf缺点:

    • 训练慢:需要2~3天,渲染图要几十秒
    • 渲染结果几何比较差
    • 基于静态场景的假设,不适用动态场景(本文主要解决的问题)

2.2. 续改进论文:

2. 主要内容

本文主要解决"基于静态场景的假设,不适用动态场景"的问题

2.1. 之前的工作

2.2. 本文内容:

  • 之前工作在刚体运动的场景比较复杂了,因为通过刚体运动就可以建立

2.3. 其他内容

  • 4D标注:
    • object pose不准,会导致渲染的时候出现汽车跳动的问题
      • 原因:现有的3D目标检测标注不准
        • 1.单目标注的不具有尺度度量(真实世界尺度)
        • 2.不用来做重建,不考虑帧间的一致性
    • 通过mask(车)做仿真
  • 行人和车辆的交换:现在还没考虑分刚体的行人仿真
  • 没有考虑shadow和weather的变化
  • 物理仿真(物理方程)
  • KITTI 10G显存就行了
  • 在waymo数据上做的:标注框不是很准,但是直行还行,转弯不行
    • nuscenes数据集:camera pose /object pose都不是很准,试验很多次效果不好
相关推荐
Felaim2 小时前
评估自动驾驶(AD)策略性能的关键指标
人工智能·机器学习·自动驾驶
ywfwyht20 小时前
grok3设计一个自动驾驶VLM模型
人工智能·机器学习·自动驾驶
白云千载尽20 小时前
大语言加持的闭环端到端自动驾驶模型 学习笔记纯干货
论文阅读·笔记·学习·自动驾驶·carla·vlm
luoganttcc1 天前
介绍一下在自动驾驶 路径规划和 控制算法 详细一些
人工智能·机器学习·自动驾驶
我们的五年3 天前
硬件加速与技术创新双轮驱动:DeepSeek和ChatGPT性能进阶的未来蓝图
人工智能·chatgpt·自动驾驶·汽车·deepseek
@Mr_LiuYang3 天前
从图片生成3维场景--NERF原理解析及加速版HashNeRF-pytorch代码实现
nerf·神经辐射场·3维场景生成·2维转3维·hashnerf
Felaim4 天前
基于模仿学习(IL)的端到端自动驾驶发展路径
人工智能·深度学习·自动驾驶
香橙薄荷心4 天前
人工智能之自动驾驶技术体系
人工智能·机器学习·自动驾驶
楼台的春风5 天前
【MCU驱动开发概述】
c语言·驱动开发·单片机·嵌入式硬件·mcu·自动驾驶·嵌入式
青衫弦语6 天前
【论文精读】VLM-AD:通过视觉-语言模型监督实现端到端自动驾驶
人工智能·深度学习·语言模型·自然语言处理·自动驾驶