神经重建在自动驾驶模拟中的应用

验证自动驾驶软件需要数百万公里的测试。这不仅意味着系统开发周期长,而且系统的复杂度也会不断增加,同时,大规模的实车测试也会耗费巨量的资源并且可能会面临未知的安全问题。aiSim这样的虚拟仿真工具可以减轻真实世界测试的负担。

AD和ADAS系统依靠闭环验证来确保安全性和性能。然而,实现闭环评估需要一个能够准确代表真实世界场景的3D环境。虽然这些3D环境可以由3D设计工程师手工构建,但这种方案很难解决Sim2Real的差距并且在可扩展方面存在一定的局限性。为此,本文为您介绍神经重建如何打破限制,在自动驾驶模拟中的具体应用。


目录

一、神经渲染------弥合差距

1、优点:

2、缺点:

二、现有生成模型的挑战

三、康谋混合解决方案:集成式神经重建

1、虚拟动态内容插入

2、多模态渲染:

3、相机虚拟化:


一、神经渲染------弥合差距

神经渲染可以利用深度学习技术来缓解这个问题,它可以从一个新的视角上逼真地渲染静态(和动态)环境。当然这种方法也存在一定的优劣点:

1、优点:

(1)高保真的仿真质量:神经渲染可以产生几乎和现实无异的场景,增强现实感。

(2)数据驱动和可扩展:这种方法具有可扩展性,使其适用于实时应用(如3D高斯泼溅)。

2、缺点:

(1)分布外的对象:神经渲染很难将分布外(即以前未见过的)的对象插入 3D 环境中。

(2)伪影对动态物体的影响:伪影可能会影响动态物体的外观。

(3)几何不一致:在深度预测中,可能会出现几何不一致。

二、现有生成模型的挑战

目前的生成模型能够创建高度逼真的图像和视频,但它们在几个方面存在不足,例如:

(1)仅 2D 信息:这些模型不提供 3D 信息,仅在 2D 图像空间中操作。

(2)射影几何的空白:更多内容请参见https://arxiv.org/abs/2311.17138

(3)有限的传感器模态:这些模型不能用于生成其他传感器模态(例如,激光雷达)。

总之,当前的生成模型不适合汽车级验证。

三、康谋混合解决方案:集成式神经重建

为了解决这些限制,aiSim5提供了一种混合方案。在成熟的基于物理的渲染方案中集成最前沿的神经重建技术,使我们能够在任意位置虚拟地插入动态对象,调整环境条件,并渲染以前未见过的相机视角。

通过这种方式,我们能实现以下的功能:

1、虚拟动态内容插入

(1)添加具有逼真光照和环境光遮蔽的动态对象。

(2)模拟如雨、雪、雾等环境效果,以创建更多样化的模拟场景。

2、多模态渲染:

(1)从任意相机视角生成精确的RGB图像、深度图和激光雷达强度图(如下图所示,第一行为GT)。

(2)未来的工作将包括语义分割掩码和雷达仿真。

3、相机虚拟化:

(1)模拟各种虚拟相机设置,包括不同的相机的安装和定向以及模型。

(2)下图展示了模拟的前置鱼眼(左)、前置广角(中)和前置长距(右)相机的渲染效果,这些图像是通过一个没有直接使用前置相机数据训练的模型生产的,也就是说,这些视角并没有专门采集数据进行训练。


如您对上述产品和解决方案感兴趣,

欢迎联系康谋自动驾驶团队了解更多信息。

我们将竭诚为您服务!

期待与您的交流!

康谋aiSim自动驾驶仿真模拟平台 - 端到端的ADAS/AD仿真工具 | 物理级传感器仿真 | 高精度环境模拟康谋自动驾驶仿真软件-aiSim,全球首个通过ISO 26262 ASIL D认证的汽车仿真工具。搭载自研确定性仿真引擎aiSim AIR Engine,提供物理级传感器仿真和高精度环境模拟,可基于真实场景建模,支持多路视频并行输出,提供完整测试报告和分析指南。https://keymotek.com/adas-simulator-aisim/

相关推荐
蹦蹦跳跳真可爱58913 分钟前
Python----大模型(使用api接口调用大模型)
人工智能·python·microsoft·语言模型
小爷毛毛_卓寿杰14 分钟前
突破政务文档理解瓶颈:基于多模态大模型的智能解析系统详解
人工智能·llm
Mr.Winter`15 分钟前
障碍感知 | 基于3D激光雷达的三维膨胀栅格地图构建(附ROS C++仿真)
人工智能·机器人·自动驾驶·ros·具身智能·环境感知
好开心啊没烦恼24 分钟前
Python 数据分析:numpy,抽提,整数数组索引与基本索引扩展(元组传参)。听故事学知识点怎么这么容易?
开发语言·人工智能·python·数据挖掘·数据分析·numpy·pandas
磊叔的技术博客30 分钟前
LLM 系列(六):模型推理篇
人工智能·面试·llm
爱分享的飘哥30 分钟前
【V6.0 - 听觉篇】当AI学会“听”:用声音特征捕捉视频的“情绪爽点”
人工智能·音视频
fzyz12337 分钟前
Windows系统下WSL从C盘迁移方案
人工智能·windows·深度学习·wsl
BIYing_Aurora39 分钟前
【IPMV】图像处理与机器视觉:Lec13 Robust Estimation with RANSAC
图像处理·人工智能·算法·计算机视觉
数据与人工智能律师1 小时前
数字资产革命中的信任之锚:RWA法律架构的隐形密码
大数据·网络·人工智能·云计算·区块链
CHANG_THE_WORLD1 小时前
封装一个png的编码解码操作
图像处理·人工智能·计算机视觉