目标检测一阶段模型

目标检测的基本思路:定位localization+识别recognition

  • 一个分支用于做图像分类,即全连接 + Softmax 判断目标类别,和单纯图像分类区别在于这里还另外需要一个「背景」类。
  • 另一个分支用于识别目标位置,即完成回归任务输出四个数字标记包围盒位置(例如中心点横纵坐标和包围盒长宽),该分支输出结果只有在分类分支判断不为「背景」时才使用

一阶段(One Stage )

不需要产生候选框,只需一次提取特征即可实现目标检测。直接将目标框定位的问题转化为回归(Regression)问题处理(Process)。

常见的算法有YOLO、SSD等等。

是怎么等效成回归问题的呢?

两阶段(Two Stages)

首先由算法(algorithm)生成一系列作为样本的候选框,再通过卷积神经网络进行分类。

常见的算法有 R-CNN、Fast R-CNN、Faster R-CNN 等等。

一阶段模型将目标检测看作端到端的回归问题,输入图片,输出五个结果**(x,y,w,h,score)+类别** ,其中score是框的置信度**,即该位置是否包含目标以及包含目标的准确性(IoU)。(x,y,w,h)是相对于Anchor的四个偏移量**

ssd输出

发展历程

目标检测模型对比:

Huang et al,"Speedlaccuracy trade-offs for modern convolutional object detectors", CVPR2017

相关推荐
收放扳机19 小时前
高速抓取场景下的视觉引导与并联机械手控制分析
人工智能·科技·自动化·制造·pcb工艺
段一凡-华北理工大学19 小时前
2026 高炉炼铁智能化技术全景与演进路径~系列文章03:高炉工业数据治理标准化与全生命周期血缘体系
网络·人工智能·高炉炼铁·工业智能体·炉温监测·高炉智能化
Agent手记19 小时前
制造业生产安全隐患智能识别系统落地指南 —— 结合企业级Agent构建国产安全闭环防御体系
人工智能·安全·ai
搬砖的小码农_Sky19 小时前
NVIDIA Geforce RTX 5060 Ti显卡能本地部署的哪些AI应用?
人工智能·ai·gpu算力·agi
司九Nineteen19 小时前
AI 中转的原理是什么?为什么中转站比官方便宜很多?
人工智能
大哥教你梳中分119 小时前
2026 年最具性价比 AI API 中转站实测:GPT-5.5/Claude Opus/DeepSeek 全接入,价格低至官方 1/13
人工智能·gpt
沅柠-AI营销19 小时前
ChatGPT GEO深度拆解:从专业底层逻辑到高阶流量壁垒的完整打法
人工智能·chatgpt·数据分析·品牌营销·ai搜索优化·geo优化
可涵不会debug19 小时前
对比QClaw和其他Claw,ToDesk AI凭什么更省额度、回答更详细?亲身体验告诉你
人工智能
wei_shuo19 小时前
基于魔珐星云打造的3D智能数字人:语音随时打断、毫秒级AI流式对话、WebGL2.0实时渲染
人工智能·魔珐星云
User_芊芊君子19 小时前
KouriChat + DeepSeek + 微信接入:本地 AI 角色聊天机器人搭建实录
人工智能·微信·机器人