目标检测一阶段模型

目标检测的基本思路:定位localization+识别recognition

  • 一个分支用于做图像分类,即全连接 + Softmax 判断目标类别,和单纯图像分类区别在于这里还另外需要一个「背景」类。
  • 另一个分支用于识别目标位置,即完成回归任务输出四个数字标记包围盒位置(例如中心点横纵坐标和包围盒长宽),该分支输出结果只有在分类分支判断不为「背景」时才使用

一阶段(One Stage )

不需要产生候选框,只需一次提取特征即可实现目标检测。直接将目标框定位的问题转化为回归(Regression)问题处理(Process)。

常见的算法有YOLO、SSD等等。

是怎么等效成回归问题的呢?

两阶段(Two Stages)

首先由算法(algorithm)生成一系列作为样本的候选框,再通过卷积神经网络进行分类。

常见的算法有 R-CNN、Fast R-CNN、Faster R-CNN 等等。

一阶段模型将目标检测看作端到端的回归问题,输入图片,输出五个结果**(x,y,w,h,score)+类别** ,其中score是框的置信度**,即该位置是否包含目标以及包含目标的准确性(IoU)。(x,y,w,h)是相对于Anchor的四个偏移量**

ssd输出

发展历程

目标检测模型对比:

Huang et al,"Speedlaccuracy trade-offs for modern convolutional object detectors", CVPR2017

相关推荐
wuyoula15 小时前
全新轻量级高性能跨平台 AI聊天+AI网关桌面
服务器·开发语言·c++·人工智能
F_D_Z15 小时前
扩散模型快速采样:从渐进蒸馏到并行推理
人工智能·算法·加速采样
AIBox36515 小时前
vscode api 配置怎么做:第三方大模型接入 VS Code 的完整方法
ide·人工智能·vscode·gpt·语言模型·编辑器
zhang1338308907515 小时前
守护水工安全:CG-85D振弦式渗压计在大坝与堤防监测中的核心作用
运维·服务器·网络·人工智能·自动化
鸿乃江边鸟15 小时前
Nanobot 从 Channel 消息处理看python协程的使用
人工智能·ai·协程
岁月标记15 小时前
MoE 混合专家模型
人工智能
才兄说15 小时前
机器人二次开发动作定制?数周内交付
人工智能·机器人
石榴树下的七彩鱼15 小时前
Python OCR 文字识别 API 接入完整教程
开发语言·人工智能·后端·python·ocr·api·图片识别
芯盾时代15 小时前
RSAC 2026观察 智能体治理崛起
网络·人工智能·网络安全·智能体
十铭忘15 小时前
Scaling Latent Reasoning via Looped Language Models:通过循环语言模型扩展潜在推理
人工智能