目标检测一阶段模型

坠金2024-11-04 0:09

目标检测的基本思路：定位localization+识别recognition

一个分支用于做图像分类，即全连接 + Softmax 判断目标类别，和单纯图像分类区别在于这里还另外需要一个「背景」类。
另一个分支用于识别目标位置，即完成回归任务输出四个数字标记包围盒位置(例如中心点横纵坐标和包围盒长宽)，该分支输出结果只有在分类分支判断不为「背景」时才使用

一阶段（One Stage ）

不需要产生候选框，只需一次提取特征即可实现目标检测。直接将目标框定位的问题转化为回归（Regression）问题处理(Process)。

常见的算法有YOLO、SSD等等。

是怎么等效成回归问题的呢？

两阶段（Two Stages）

首先由算法（algorithm）生成一系列作为样本的候选框，再通过卷积神经网络进行分类。

常见的算法有 R-CNN、Fast R-CNN、Faster R-CNN 等等。

一阶段模型将目标检测看作端到端的回归问题，输入图片，输出五个结果**(x,y,w,h,score)+类别** ，其中score是框的置信度**，即该位置是否包含目标以及包含目标的准确性(IoU)。(x,y,w,h)是相对于Anchor的四个偏移量**

ssd输出

发展历程

目标检测模型对比：

Huang et al,"Speedlaccuracy trade-offs for modern convolutional object detectors", CVPR2017

上一篇：WPF+MVVM案例实战（十九）- 自定义字体图标按钮的封装与实现（EF类）

下一篇：RabbitMQ应用

热门推荐

01GitHub 镜像站点 02如何新建文件夹？电脑新建文件夹的4种方法 0300 Debian字符界面如何支持中文 04国内可直接用、免费额度/永久免费的大模型API清单（含 SiliconFlow、火山、阿里、智谱、百度、Kimi、DeepSeek、DMXAPI 等）05微信历史版本含下载地址（ Windows PC | 安卓 | MAC ）及设置微信不更新 062026 国产 AI 大模型横评：DeepSeek、通义千问、Kimi、文心一言、星火、豆包谁更能打？072026年7月AI圈大地震：GPT-5.6被政府限制、Claude入驻Slack、Anthropic自研芯片 08AI 编程 IDE 全景解析 2026：Agent 全面接管开发链路 09Agnes AI 免费 API 接入指南：文本、生图、生视频，一套接口全免费 102026 年 AI 大模型 & AI 编程工具实战全总结