LSS论文阅读

计算机视觉通用做法:

通常将图像作为输入,并输出一个与坐标系无关的预测(例如在分类中 [19, 30, 16, 17])

或一个与输入图像相同坐标系中的预测(例如在目标检测、语义分割或全景分割中 [7, 1, 15, 36])

单目3d目标检测分为3类

1、二阶段,第一阶段网络学习2d目标检测,第二阶段网络学习2d到3d的恢复

2、伪lidar:学习深度估计,同时预测bev

3、类似于detr3d,用3维参考点,基于内外参去各个2维图像上收集信息

BEV有两个体系

第一种体系是LSS, 通过显示深度估计获取3d信息

第二种体系是BEVFormer,通过3d采样点投影到2d来获取信息。

pipeline

图像特征提取-> lift升为3维-->外参矩阵获取2d信息->splat,将3维信息拍平到bev平面上

特点

1、训练从6个图像中随意选5个,进而使模型获取对任意相机的处理能力

2、对内外参增加噪声,用于应对内外参噪声的问题。

相关推荐
程序员佳佳4 分钟前
【万字硬核】从零构建企业级AI中台:基于Vector Engine整合GPT-5.2、Sora2与Veo3的落地实践指南
人工智能·gpt·chatgpt·ai作画·aigc·api·ai编程
weixin_437988125 分钟前
范式推出面向AGI的Phanthy平台
人工智能·agi
EEPI10 分钟前
【论文阅读】Igniting VLMs toward the Embodied Space
论文阅读
Hcoco_me25 分钟前
RNN(循环神经网络)
人工智能·rnn·深度学习
踏浪无痕33 分钟前
AI 时代架构师如何有效成长?
人工智能·后端·架构
AI 智能服务34 分钟前
第6课__本地工具调用(文件操作)
服务器·人工智能·windows·php
clorisqqq1 小时前
人工智能现代方法笔记 第1章 绪论(1/2)
人工智能·笔记
kisshuan123961 小时前
YOLO11-RepHGNetV2实现甘蔗田杂草与作物区域识别详解
人工智能·计算机视觉·目标跟踪
焦耳热科技前沿1 小时前
北京科技大学/理化所ACS Nano:混合价态Cu₂Sb金属间化合物实现高效尿素电合成
大数据·人工智能·自动化·能源·材料工程
C+-C资深大佬1 小时前
Creo 11.0 全功能解析:多体设计 + 仿真制造,机械设计效率翻倍下载安装
人工智能