目标检测一阶段模型

目标检测的基本思路:定位localization+识别recognition

  • 一个分支用于做图像分类,即全连接 + Softmax 判断目标类别,和单纯图像分类区别在于这里还另外需要一个「背景」类。
  • 另一个分支用于识别目标位置,即完成回归任务输出四个数字标记包围盒位置(例如中心点横纵坐标和包围盒长宽),该分支输出结果只有在分类分支判断不为「背景」时才使用

一阶段(One Stage )

不需要产生候选框,只需一次提取特征即可实现目标检测。直接将目标框定位的问题转化为回归(Regression)问题处理(Process)。

常见的算法有YOLO、SSD等等。

是怎么等效成回归问题的呢?

两阶段(Two Stages)

首先由算法(algorithm)生成一系列作为样本的候选框,再通过卷积神经网络进行分类。

常见的算法有 R-CNN、Fast R-CNN、Faster R-CNN 等等。

一阶段模型将目标检测看作端到端的回归问题,输入图片,输出五个结果**(x,y,w,h,score)+类别** ,其中score是框的置信度**,即该位置是否包含目标以及包含目标的准确性(IoU)。(x,y,w,h)是相对于Anchor的四个偏移量**

ssd输出

发展历程

目标检测模型对比:

Huang et al,"Speedlaccuracy trade-offs for modern convolutional object detectors", CVPR2017

相关推荐
阳光是sunny14 小时前
别再被 worktree 绕晕了!AI 编程时代你必须掌握的 Git 隔离神器
前端·人工智能·后端
冬奇Lab15 小时前
每日一个开源项目(第148篇):obsidian-skills - Obsidian CEO 亲写的 AI Agent 格式规范,让 Agent 不再破坏你的 Vault
人工智能·开源·资讯
ethantan15 小时前
AI Agent 组成:像人一样思考的智能体
人工智能·程序员·架构
冬奇Lab15 小时前
Workflow 系列(05):评测体系——三层测试结构与 Trace 追踪
人工智能·工作流引擎
ethantan16 小时前
一篇讲解AI Agent 组成:像人一样思考的智能体
人工智能·后端·程序员
Cosolar18 小时前
vLLM 生产级部署完全指南
人工智能·后端·架构
CodePlayer竟然被占用了18 小时前
被美国政府封杀18天,Claude Fable 5 回来了——但代价是什么?
人工智能
IT_陈寒18 小时前
垃圾回收器选错了,我的Java服务内存炸了
前端·人工智能·后端
smartpi19 小时前
SmartPi GPIO 脉冲与回复语执行时序指南
人工智能
阿里云大数据AI技术19 小时前
PAI支持一键部署GLM-5.2,Coding能力比肩Claude Opus 4.8
人工智能