目标检测相关【清晰易懂】

目标检测相关

(b)是语义分割,(c)是实例分割

  • 目标检测 = 每个目标一个框+标签

  • 实例分割 = 语义分割 + 识别每一个目标个体

目标检测基础上进一步提升模型能力有两个方向:实例分割、旋转目标检测。

实例分割

(1)定义

目标检测的进一步扩展,不仅定位物体的位置 ,而且给出物体的精确轮廓 。它通常需要通过 mask 来标注每个物体的像素级区域

(2)实现方式

一般是在目标检测的基础上,增加一个分割分支(输出掩膜 mask),典型代表是:

  • Mask R-CNN:Faster R-CNN 加上分割头

  • YOLACT / SOLO / Mask2Former:更快更灵活的分割方式

  • 一些最新的 segment anything 模型也属于这个方向

旋转目标检测

(1)定义

目标检测不仅检测物体的位置,还要精确预测物体的角度 ,通过旋转的矩形框来标注物体,而不是简单的水平矩形框。

例如,在遥感卫星图像里检测船只,如果不用旋转框,可能一个框套住了两艘船。而旋转框可以斜着框住每一艘船,更准确。

(2)实现方式

在原有框架上,模型输出的框格式从 [x, y, w, h] 变为 [x, y, w, h, θ],多了一个角度θ

典型代表模型有:

  • RTMDet

  • R3Det(Refined Rotated RetinaNet)

  • Rotated Faster R-CNN

  • Oriented R-CNN

  • 基于 YOLO 的旋转目标检测(比如 YOLOv5-OBB)

语义分割和实例分割对比

项目 语义分割 实例分割
像素级别分类
区分个体 ❌ 不行(只知道种类) ✅ 可以(知道是哪一个物体)
应用 场景理解、自动驾驶道路分割等 高级视觉识别(如COCO、人脸遮挡处理)
难度 相对较低 更高(要结合检测)

目标检测、实例分割和旋转目标检测的关系

  • 目标检测实例分割常常是顺序执行的,先做目标检测,后做实例分割。

  • 旋转目标检测通常是独立的任务,也可以与目标检测或实例分割并行进行,专注于处理旋转物体的定位和角度预测。

相关推荐
墨北小七15 小时前
使用InspireFace进行智慧楼宇门禁人脸识别的训练微调
人工智能·深度学习·神经网络
HackTorjan15 小时前
深度神经网络的反向传播与梯度优化原理
人工智能·spring boot·神经网络·机器学习·dnn
PersistJiao16 小时前
Codex、Claude Code、gstack三者的关系
人工智能
一切皆是因缘际会16 小时前
AI数字分身的底层原理:破解意识、自我与人格复刻的核心难题
大数据·人工智能·ai·架构
翔云12345616 小时前
vLLM全解析:定义、用途与竞品对比
人工智能·ai·大模型
ASKED_201916 小时前
KDD Cup 2026 腾讯算法广告大赛赛题解读: UNI-REC (统一序列建模与特征交叉)
人工智能
fpcc16 小时前
AI和大模型——Fine-tuning
人工智能·深度学习
爱问的艾文17 小时前
八周带你手搓AI应用-Day4-赋予你的AI“记忆力”
人工智能
ACP广源盛1392462567317 小时前
IX8024与科学大模型的碰撞@ACP#筑牢科研 AI 算力高速枢纽分享
运维·服务器·网络·数据库·人工智能·嵌入式硬件·电脑
向量引擎17 小时前
向量引擎接入 GPT Image 2 和 deepseek v4:一个 api key 把热门模型串起来,开发者终于不用深夜修接口了
人工智能·gpt·计算机视觉·aigc·api·ai编程·key