什么是 mmdet3d - 技术栈

mmdet3d 是 MMDetection3D 的简称，它是一个基于 PyTorch 的开源 3D 目标检测与分割工具箱，由 OpenMMLab 团队开发（该团队还开发了 MMDetection、MMClassification 等知名深度学习工具）。其核心目标是为 3D 视觉任务提供灵活、高效、可扩展的代码框架，方便研究者和开发者快速实现、测试和部署 3D 感知算法。

核心功能与特点

支持多种 3D 任务
涵盖主流 3D 视觉任务，包括：
- 3D 目标检测（如检测点云中的车辆、行人、障碍物等）；
- 3D 语义分割（如给点云中的每个点分配类别，如地面、建筑、植被等）；
- 多模态融合（支持点云、RGB 图像、深度图等多种传感器数据的融合处理）。
丰富的算法实现
集成了大量主流 3D 感知算法，开箱即用，例如：
- 纯点云算法：PointPillars、SECOND、PointRCNN、PV-RCNN 等；
- 多模态算法：BEVFormer、FCOS3D、SMOKE 等（融合图像与点云）；
- 3D 分割算法：PointNet++、VoteNet、ScanNet 等。
兼容主流数据集
支持 3D 领域常用数据集的自动加载与处理，如：
- 自动驾驶场景：KITTI、nuScenes、Waymo Open Dataset；
- 室内场景：SUN RGB-D、S3DIS、ScanNet；
- 其他：Lyft、Argoverse 等。
模块化设计
采用模块化架构（如数据加载、模型构建、损失函数、评估指标等均可独立配置），便于开发者快速替换组件、复现论文或开发新算法。
生态集成与工具链
与 OpenMMLab 其他工具（如 MMDetection、MMCV）无缝衔接，支持模型训练、推理、可视化、部署等全流程，并提供预训练模型供直接使用。

应用场景

自动驾驶：车辆、行人、交通标志的 3D 检测与定位；
机器人感知：室内机器人对环境的 3D 语义理解；
三维重建：点云场景的分割与解析；
无人机感知：空中视角的 3D 目标检测等。

总结

MMDetection3D 是 3D 视觉领域的重要工具，尤其在自动驾驶和机器人感知方向应用广泛。它降低了 3D 算法的实现门槛，支持快速验证新想法，同时提供了工业级的性能基准，是学术研究和工程落地的常用选择。
官网与文档： https://mmdetection3d.readthedocs.io
GitHub 仓库： https://github.com/open-mmlab/mmdetection3d