目标检测相关【清晰易懂】

目标检测相关

(b)是语义分割,(c)是实例分割

  • 目标检测 = 每个目标一个框+标签

  • 实例分割 = 语义分割 + 识别每一个目标个体

目标检测基础上进一步提升模型能力有两个方向:实例分割、旋转目标检测。

实例分割

(1)定义

目标检测的进一步扩展,不仅定位物体的位置 ,而且给出物体的精确轮廓 。它通常需要通过 mask 来标注每个物体的像素级区域

(2)实现方式

一般是在目标检测的基础上,增加一个分割分支(输出掩膜 mask),典型代表是:

  • Mask R-CNN:Faster R-CNN 加上分割头

  • YOLACT / SOLO / Mask2Former:更快更灵活的分割方式

  • 一些最新的 segment anything 模型也属于这个方向

旋转目标检测

(1)定义

目标检测不仅检测物体的位置,还要精确预测物体的角度 ,通过旋转的矩形框来标注物体,而不是简单的水平矩形框。

例如,在遥感卫星图像里检测船只,如果不用旋转框,可能一个框套住了两艘船。而旋转框可以斜着框住每一艘船,更准确。

(2)实现方式

在原有框架上,模型输出的框格式从 [x, y, w, h] 变为 [x, y, w, h, θ],多了一个角度θ

典型代表模型有:

  • RTMDet

  • R3Det(Refined Rotated RetinaNet)

  • Rotated Faster R-CNN

  • Oriented R-CNN

  • 基于 YOLO 的旋转目标检测(比如 YOLOv5-OBB)

语义分割和实例分割对比

项目 语义分割 实例分割
像素级别分类
区分个体 ❌ 不行(只知道种类) ✅ 可以(知道是哪一个物体)
应用 场景理解、自动驾驶道路分割等 高级视觉识别(如COCO、人脸遮挡处理)
难度 相对较低 更高(要结合检测)

目标检测、实例分割和旋转目标检测的关系

  • 目标检测实例分割常常是顺序执行的,先做目标检测,后做实例分割。

  • 旋转目标检测通常是独立的任务,也可以与目标检测或实例分割并行进行,专注于处理旋转物体的定位和角度预测。

相关推荐
元宇宙时间30 分钟前
全球发展币GDEV:从中国出发,走向全球的数字发展合作蓝图
大数据·人工智能·去中心化·区块链
小黄人20251 小时前
自动驾驶安全技术的演进与NVIDIA的创新实践
人工智能·安全·自动驾驶
ZStack开发者社区2 小时前
首批 | 云轴科技ZStack加入施耐德电气技术本地化创新生态
人工智能·科技·云计算
千宇宙航2 小时前
闲庭信步使用图像验证平台加速FPGA的开发:第六课——测试图案的FPGA实现
图像处理·计算机视觉·fpga开发
X Y O3 小时前
神经网络初步学习3——数据与损失
人工智能·神经网络·学习
唯创知音3 小时前
玩具语音方案选型决策OTP vs Flash 的成本功耗与灵活性
人工智能·语音识别
Jamence3 小时前
多模态大语言模型arxiv论文略读(151)
论文阅读·人工智能·语言模型·自然语言处理·论文笔记
tongxianchao3 小时前
LaCo: Large Language Model Pruning via Layer Collapse
人工智能·语言模型·剪枝
HyperAI超神经3 小时前
OmniGen2 多模态推理×自我纠正双引擎,引领图像生成新范式;95 万分类标签!TreeOfLife-200M 解锁物种认知新维度
人工智能·数据挖掘·数据集·图像生成·医疗健康·在线教程·数学代码
网安INF4 小时前
深度学习中批标准化与神经网络调优
人工智能·深度学习·神经网络·机器学习