目标检测一阶段模型

目标检测的基本思路:定位localization+识别recognition

  • 一个分支用于做图像分类,即全连接 + Softmax 判断目标类别,和单纯图像分类区别在于这里还另外需要一个「背景」类。
  • 另一个分支用于识别目标位置,即完成回归任务输出四个数字标记包围盒位置(例如中心点横纵坐标和包围盒长宽),该分支输出结果只有在分类分支判断不为「背景」时才使用

一阶段(One Stage )

不需要产生候选框,只需一次提取特征即可实现目标检测。直接将目标框定位的问题转化为回归(Regression)问题处理(Process)。

常见的算法有YOLO、SSD等等。

是怎么等效成回归问题的呢?

两阶段(Two Stages)

首先由算法(algorithm)生成一系列作为样本的候选框,再通过卷积神经网络进行分类。

常见的算法有 R-CNN、Fast R-CNN、Faster R-CNN 等等。

一阶段模型将目标检测看作端到端的回归问题,输入图片,输出五个结果**(x,y,w,h,score)+类别** ,其中score是框的置信度**,即该位置是否包含目标以及包含目标的准确性(IoU)。(x,y,w,h)是相对于Anchor的四个偏移量**

ssd输出

发展历程

目标检测模型对比:

Huang et al,"Speedlaccuracy trade-offs for modern convolutional object detectors", CVPR2017

相关推荐
生成论实验室1 分钟前
给机器人和自动驾驶装上判断力,会怎样?
人工智能·深度学习·机器学习·机器人·自动驾驶
GIS6688003 分钟前
赛事解读|第十八届全国高校GIS技能大赛【操作赛道】参赛题目及规范要求
大数据·人工智能·gis开发·gis大赛
我滴老baby6 分钟前
Transformer深入详解-现代大模型核心架构
深度学习·架构·transformer
weixin_468466856 分钟前
目标识别算法落地实战:从选型到部署的全流程指南
图像处理·人工智能·python·算法·目标检测·机器视觉·目标识别
词元Max7 分钟前
2.12 pytest 实战:如何测试 AI 应用
人工智能·pytest
Swift社区7 分钟前
规模化AI:企业落地的破局时刻
人工智能
不会学习的小白O^O7 分钟前
MOSP:一种用于机器人采集的繁育棉质多方向采摘计划
人工智能·机器人
RD_daoyi8 分钟前
Google 官方调整抓取工具 IP 文件路径:SEO 与服务器安全策略要变了?
服务器·人工智能·学习·tcp/ip·搜索引擎·chatgpt
小陈phd10 分钟前
多模态大模型学习笔记(四十一)——从 “能看“ 到 “会想“:一文看懂多模态大模型的三代演进之路
人工智能·笔记·学习
Cosolar10 分钟前
2026 年 AI 开源生态全景图
人工智能·面试·大模型·agent·rag