目标检测相关【清晰易懂】

目标检测相关

(b)是语义分割,(c)是实例分割

  • 目标检测 = 每个目标一个框+标签

  • 实例分割 = 语义分割 + 识别每一个目标个体

目标检测基础上进一步提升模型能力有两个方向:实例分割、旋转目标检测。

实例分割

(1)定义

目标检测的进一步扩展,不仅定位物体的位置 ,而且给出物体的精确轮廓 。它通常需要通过 mask 来标注每个物体的像素级区域

(2)实现方式

一般是在目标检测的基础上,增加一个分割分支(输出掩膜 mask),典型代表是:

  • Mask R-CNN:Faster R-CNN 加上分割头

  • YOLACT / SOLO / Mask2Former:更快更灵活的分割方式

  • 一些最新的 segment anything 模型也属于这个方向

旋转目标检测

(1)定义

目标检测不仅检测物体的位置,还要精确预测物体的角度 ,通过旋转的矩形框来标注物体,而不是简单的水平矩形框。

例如,在遥感卫星图像里检测船只,如果不用旋转框,可能一个框套住了两艘船。而旋转框可以斜着框住每一艘船,更准确。

(2)实现方式

在原有框架上,模型输出的框格式从 [x, y, w, h] 变为 [x, y, w, h, θ],多了一个角度θ

典型代表模型有:

  • RTMDet

  • R3Det(Refined Rotated RetinaNet)

  • Rotated Faster R-CNN

  • Oriented R-CNN

  • 基于 YOLO 的旋转目标检测(比如 YOLOv5-OBB)

语义分割和实例分割对比

项目 语义分割 实例分割
像素级别分类
区分个体 ❌ 不行(只知道种类) ✅ 可以(知道是哪一个物体)
应用 场景理解、自动驾驶道路分割等 高级视觉识别(如COCO、人脸遮挡处理)
难度 相对较低 更高(要结合检测)

目标检测、实例分割和旋转目标检测的关系

  • 目标检测实例分割常常是顺序执行的,先做目标检测,后做实例分割。

  • 旋转目标检测通常是独立的任务,也可以与目标检测或实例分割并行进行,专注于处理旋转物体的定位和角度预测。

相关推荐
用户5191495848454 分钟前
CrushFTP 条件竞争认证绕过漏洞利用工具 (CVE-2025-54309)
人工智能·aigc
一拳不是超人12 分钟前
AI时代,35岁程序员焦虑终结:经验从负债变资产
人工智能·程序员
IT_陈寒1 小时前
Vite快得离谱?揭秘它比Webpack快10倍的5个核心原理
前端·人工智能·后端
风象南2 小时前
OpenClaw 登顶 GitHub Star 榜首:一个程序员 13 年后的"重新点火"故事
人工智能·后端
TF男孩11 小时前
重新认识Markdown:它不仅是排版工具,更是写Prompt的最佳结构
人工智能
想打游戏的程序猿12 小时前
AI时代的内容输出
人工智能
小兵张健12 小时前
Playwright MCP 截图标注方案调研:推荐方案 1
人工智能
凌杰14 小时前
AI 学习笔记:Agent 的能力体系
人工智能
IT_陈寒15 小时前
React状态管理终极对决:Redux vs Context API谁更胜一筹?
前端·人工智能·后端
舒一笑16 小时前
如何获取最新的技术趋势和热门技术
人工智能·程序员