BEVDepth- Acquisition of Reliable Depth for Multi-view 3D Object Detection

justtoomuchforyou2025-05-29 13:04

中科院旷视 AAAI 2023

纯视觉多相机BEV方案检测模型

code：https://github.com/Megvii-BaseDetection/BEVDepth

paper：BEVDepth: Acquisition of Reliable Depth for Multi-View 3D Object Detection| Proceedings of the AAAI Conference on Artificial Intelligence

输入：N帧环视相机

过程：

CNN抽2D图像特征
DepthNet从2D特征建模深度
1. 点云+相机内外参计算图像深度信息（2.5D图像）
2. min pooling+one hot，计算深度真值
3. depth网络里加残差、deformable conv扩大感受野，抵消相机外参变化带来的影响（？）
4. camera-awareness DepthNet
  1. 目的：提升深度分类效果
  2. 方案：相机内参作为DepthNet网络输入
    1. MLP层：expand内参到特征同维数
    2. SE层：融合2D特征+相机内外参
5. 提效voxel pooling
  1. 方案：自定义cuda算子VoxelPoolingTrain
view transformer用2D图像特征+深度获取3D特征，再投射成bev表征
CenterPoint 3D检测头识别检测框（class，3Dbox offset，属性等）

上一篇：深入理解JavaScript设计模式之call,apply,this

下一篇：YOLOv8 区域计数系统：基于计算机视觉的智能物体计数方案

热门推荐

01全球最强模型Grok4，国内已可免费使用！（附教程）02KGG转MP3工具|非KGM文件|解密音频 03Coze扣子平台完整体验和实践（附国内和国际版对比）04身弱武修法：玄之又玄，奇妙之门 05集群聊天服务器---MySQL数据库的建立 06扣子（coze）实战|我用扣子搭建了一个自动分析小红薯笔记内容的AI应用|详细步骤拆解 07LOT: 通过逻辑增强大型语言模型的零样本Chain-of-Thought推理能力 08使用Ruby接入实时行情API教程 09DeepSeek各版本说明与优缺点分析 10基于odoo17的设计模式详解---单例模式