目标检测一阶段模型

目标检测的基本思路:定位localization+识别recognition

  • 一个分支用于做图像分类,即全连接 + Softmax 判断目标类别,和单纯图像分类区别在于这里还另外需要一个「背景」类。
  • 另一个分支用于识别目标位置,即完成回归任务输出四个数字标记包围盒位置(例如中心点横纵坐标和包围盒长宽),该分支输出结果只有在分类分支判断不为「背景」时才使用

一阶段(One Stage )

不需要产生候选框,只需一次提取特征即可实现目标检测。直接将目标框定位的问题转化为回归(Regression)问题处理(Process)。

常见的算法有YOLO、SSD等等。

是怎么等效成回归问题的呢?

两阶段(Two Stages)

首先由算法(algorithm)生成一系列作为样本的候选框,再通过卷积神经网络进行分类。

常见的算法有 R-CNN、Fast R-CNN、Faster R-CNN 等等。

一阶段模型将目标检测看作端到端的回归问题,输入图片,输出五个结果**(x,y,w,h,score)+类别** ,其中score是框的置信度**,即该位置是否包含目标以及包含目标的准确性(IoU)。(x,y,w,h)是相对于Anchor的四个偏移量**

ssd输出

发展历程

目标检测模型对比:

Huang et al,"Speedlaccuracy trade-offs for modern convolutional object detectors", CVPR2017

相关推荐
landuochong2004 分钟前
OpenClaw 架构文档
人工智能·架构·openclaw
Tony Bai22 分钟前
告别古法编程黄金时代:AI 时代不会再有新编程语言诞生的土壤
人工智能
cxr82823 分钟前
OpenClaw与NetLogo之间的调用与数据交互机制
人工智能·交互·netlogo·openclaw
Mountain and sea24 分钟前
工业机器人+AI视觉引导:从传统示教到智能抓取的实战升级
人工智能·机器人
jarvisuni30 分钟前
手搓 CodingPlan 照妖镜,TOKEN 燃烧器!
人工智能·ai编程
北京耐用通信34 分钟前
工业通信优选:耐达讯自动化实现CC-Link IE转Modbus RTU稳定传输
人工智能·物联网·网络协议·自动化·信息与通信
汉堡大王952740 分钟前
# AI 终于能"干活"了——Function Calling 完全指南
javascript·人工智能·机器学习
码路高手44 分钟前
Trae-Agent的Patch逻辑
人工智能·架构
leafyyuki1 小时前
SSE 同域长连接排队问题解析与前端最佳实践
前端·javascript·人工智能
申耀的科技观察1 小时前
【观察】“数据”为王,决胜AI下半程
人工智能