目标检测相关【清晰易懂】

目标检测相关

(b)是语义分割,(c)是实例分割

  • 目标检测 = 每个目标一个框+标签

  • 实例分割 = 语义分割 + 识别每一个目标个体

目标检测基础上进一步提升模型能力有两个方向:实例分割、旋转目标检测。

实例分割

(1)定义

目标检测的进一步扩展,不仅定位物体的位置 ,而且给出物体的精确轮廓 。它通常需要通过 mask 来标注每个物体的像素级区域

(2)实现方式

一般是在目标检测的基础上,增加一个分割分支(输出掩膜 mask),典型代表是:

  • Mask R-CNN:Faster R-CNN 加上分割头

  • YOLACT / SOLO / Mask2Former:更快更灵活的分割方式

  • 一些最新的 segment anything 模型也属于这个方向

旋转目标检测

(1)定义

目标检测不仅检测物体的位置,还要精确预测物体的角度 ,通过旋转的矩形框来标注物体,而不是简单的水平矩形框。

例如,在遥感卫星图像里检测船只,如果不用旋转框,可能一个框套住了两艘船。而旋转框可以斜着框住每一艘船,更准确。

(2)实现方式

在原有框架上,模型输出的框格式从 [x, y, w, h] 变为 [x, y, w, h, θ],多了一个角度θ

典型代表模型有:

  • RTMDet

  • R3Det(Refined Rotated RetinaNet)

  • Rotated Faster R-CNN

  • Oriented R-CNN

  • 基于 YOLO 的旋转目标检测(比如 YOLOv5-OBB)

语义分割和实例分割对比

项目 语义分割 实例分割
像素级别分类
区分个体 ❌ 不行(只知道种类) ✅ 可以(知道是哪一个物体)
应用 场景理解、自动驾驶道路分割等 高级视觉识别(如COCO、人脸遮挡处理)
难度 相对较低 更高(要结合检测)

目标检测、实例分割和旋转目标检测的关系

  • 目标检测实例分割常常是顺序执行的,先做目标检测,后做实例分割。

  • 旋转目标检测通常是独立的任务,也可以与目标检测或实例分割并行进行,专注于处理旋转物体的定位和角度预测。

相关推荐
ZhengEnCi13 小时前
09bad-斯坦福CS336作业一-构建优化器
人工智能
ZhengEnCi14 小时前
09bac-斯坦福CS336作业一-实现训练损失计算
人工智能
冬奇Lab14 小时前
Skill 系列(01):Skill 评测体系——如何量化一个 AI Skill 的质量
人工智能
兵慌码乱16 小时前
基于 MediaPipe 与 PySide2 的手势交互音乐控制系统实现:轻量化视觉交互全流程解析
python·opencv·计算机视觉·人机交互·手势识别·mediapipe·pyside2
IT_陈寒17 小时前
Redis内存爆了,原来我漏掉了这个致命配置
前端·人工智能·后端
用户35218024547519 小时前
🎆从 Prompt 到 Skill:让 Spring AI Agent 学会"装新技能"
人工智能·spring boot·ai编程
米小虾19 小时前
手把手教你搭建第一个生产级AI Agent:从选型到实战的完整指南
人工智能·agent
任沫19 小时前
Agent之Function Call
javascript·人工智能·go
米小虾19 小时前
2026年AI Agent全面爆发:从开源生态到企业级应用的进化之路
人工智能·agent
用户69190268133920 小时前
Vibe Coding 开发项目的基本范式
人工智能·设计模式·代码规范