PillarNet: Real-Time and High-PerformancePillar-based 3D Object Detection

​ECCV 2022

paper:[2205.07403] PillarNet: Real-Time and High-Performance Pillar-based 3D Object Detection

code:https://github.com/VISION-SJTU/PillarNet-LTS

纯点云基于pillar3D检测模型

网络比较

SECOND

  • 基于voxel,one-stage,基于sparse 3D conv

  • 将点云划分为3D voxel,在BEV空间识别box

  • 模型结构包括

    • encoder:编码非空3D voxel特征,生成多size3D特征

    • neck:将bev空间下的多尺度3D特征flatten,转换成多尺度(和多size区别?)特征;top-down

    • detect head:用多尺度bev特征做box分类回归

PointPillars

  • 用一个小PointNet将点云投射到xy平面,生成一个稀疏2D底图

  • 2Dconv(top-down)网络,对底图生成多尺度特征

  • detect head

分析

  • 基于pillar的网络性能瓶颈(资源性能?效果性能?)主要在于sparse encoder、neck模块

  • PointPillar直接在稠密的2d底图上 用特征金字塔网络 fuse多尺度特征

    • 缺少pillar特征编码

    • 把输出特征的size和初始pillar范围耦合了,造成所用计算资源随着pillar scale上涨

改进

  1. 将SECOND中的3d sparse conv替换成2d

  2. 用neck模块融合稀疏的空间特征、抽象高维语义特征

  3. 总结

    1. 学pillar 特征:较重的 sparse encoder

    2. 空间特征融合:较轻的neck

结构

encoder

  1. 输入:稀疏2d pillar特征

  2. stage1-4:2d conv,逐渐降采样pillar特征

    1. 可使用2d检测backbone:vgg,resnet,并且可提升3d效果

    2. 逐渐降采样,缓解了pillar size绑定的影响

neck

  1. 16倍下采样稠密特征

  2. 3种设计

    1. v1:SECOND设计

    2. v2:基于1多一条skip connection

    3. v3:基于2多一层conv

loss

  1. cls:focal loss

  2. iou:

    1. S:分类score

    2. W:3d iou score

      1. L1 loss

      2. β:超参

      3. iou计算:2 ∗ (W − 0.5) ∈ [−1, 1].

    3. 解耦朝向:xxIoU loss → OD-xxIoU

  1. size(3d box),off(位置偏移量),z(z方向位置),ori(朝向):L1 loss

相关推荐
周末程序猿15 分钟前
详解 karpathy 的 microgpt:实现一个浏览器运行的 gpt
人工智能·llm
ACP广源盛1392462567321 分钟前
破局 Type‑C 切换器痛点@ACP#GSV6155+LH3828/GSV2221+LH3828 黄金方案
c语言·开发语言·网络·人工智能·嵌入式硬件·计算机外设·电脑
xixixi7777730 分钟前
通信领域的“中国速度”:从5G-A到6G,从地面到星空
人工智能·5g·安全·ai·fpga开发·多模态
Dfreedom.1 小时前
计算机视觉全景图
人工智能·算法·计算机视觉·图像算法
EasyDSS1 小时前
智能会议管理系统/私有化视频会议平台EasyDSS私有化部署构建企业级私域视频全场景解决方案
人工智能·音视频
zhanghongbin011 小时前
成本追踪:AI API 成本计算与预算管理
人工智能
YBAdvanceFu1 小时前
从零构建智能体:深入理解 ReAct Plan Solve Reflection 三大经典范式
人工智能·python·机器学习·数据挖掘·多智能体·智能体
啦啦啦在冲冲冲2 小时前
多头注意力机制的优势是啥,遇到长文本的情况,可以从哪些情况优化呢
人工智能·深度学习
xrgs_shz2 小时前
直方图法、最大类间方差法、迭代法和自适应阈值法的图像分割的基本原理和MATLAB实现
人工智能·计算机视觉·matlab
向上的车轮2 小时前
如何定制大模型——工业场景下大模型定制与私有化部署选型
人工智能