目标检测相关【清晰易懂】

Honeysea_702025-06-18 23:48

目标检测相关

（b）是语义分割，（c）是实例分割

目标检测 = 每个目标一个框+标签
实例分割 = 语义分割 + 识别每一个目标个体

目标检测基础上进一步提升模型能力有两个方向：实例分割、旋转目标检测。

实例分割

（1）定义

目标检测的进一步扩展，不仅定位物体的位置，而且给出物体的精确轮廓 。它通常需要通过 mask 来标注每个物体的像素级区域。

（2）实现方式

一般是在目标检测的基础上，增加一个分割分支（输出掩膜 mask），典型代表是：

Mask R-CNN：Faster R-CNN 加上分割头
YOLACT / SOLO / Mask2Former：更快更灵活的分割方式
一些最新的 segment anything 模型也属于这个方向

旋转目标检测

（1）定义

目标检测不仅检测物体的位置，还要精确预测物体的角度，通过旋转的矩形框来标注物体，而不是简单的水平矩形框。

例如，在遥感卫星图像里检测船只，如果不用旋转框，可能一个框套住了两艘船。而旋转框可以斜着框住每一艘船，更准确。

（2）实现方式

在原有框架上，模型输出的框格式从 [x, y, w, h] 变为 [x, y, w, h, θ]，多了一个角度θ。

典型代表模型有：

RTMDet
R3Det（Refined Rotated RetinaNet）
Rotated Faster R-CNN
Oriented R-CNN
基于 YOLO 的旋转目标检测（比如 YOLOv5-OBB）

语义分割和实例分割对比

项目	语义分割	实例分割
像素级别分类	✅	✅
区分个体	❌ 不行（只知道种类）	✅ 可以（知道是哪一个物体）
应用	场景理解、自动驾驶道路分割等	高级视觉识别（如COCO、人脸遮挡处理）
难度	相对较低	更高（要结合检测）

目标检测、实例分割和旋转目标检测的关系

目标检测 和实例分割常常是顺序执行的，先做目标检测，后做实例分割。
旋转目标检测通常是独立的任务，也可以与目标检测或实例分割并行进行，专注于处理旋转物体的定位和角度预测。

上一篇：golang使用gopsutil获取系统信息

下一篇：知道这10个npm工具包，开发效率提高好几倍！第2个大家都用过！

热门推荐

01GitHub 镜像站点 02OpenClaw 使用和管理 MCP 完全指南 03OpenClaw + 飞书（Feishu）环境搭建指南 04Claude Code + GLM4.7 避坑指南：解决 Unable to connect to Anthropic services 05Window 10部署openclaw报错node.exe : npm error code 128 06OpenClaw优化飞书API 额度已耗尽问题 07本地部署 OpenClaw + DeepSeek-R1 完全指南 08Clawdbot部署教程：解决‘gateway token missing’授权问题的完整步骤 09网站改了域名，如何查找？10小黑课堂计算机二级WPSoffice题库软件下载安装教程（2026年3月最新版）