目标检测之SSD

目录

  • [1. SSD(Single Shot MultiBox Detector)](#1. SSD(Single Shot MultiBox Detector))
  • [2. 网络结构](#2. 网络结构)
  • [3. 流程](#3. 流程)
    • [3.1 detector & classifier](#3.1 detector & classifier)
    • [3.2 default boxes](#3.2 default boxes)
    • [3.4 localization与confidence](#3.4 localization与confidence)
  • [4. 训练流程](#4. 训练流程)
  • [5. 测试流程](#5. 测试流程)
  • [6. 总结](#6. 总结)

1. SSD(Single Shot MultiBox Detector)

SSD算法源于2016年发表的算法论文,论文网址:https://arxiv.org/abs/1512.02325

SSD的特点在于:

SSD结合了YOLO中的回归思想和Faster-RCNN中的Anchor机制,使用全图各个位置的多尺度区域进行回归,既保持了YOLO速度快的特性,也保证了窗口预测的跟Faster-RCNN一样比较精准。

SSD的核心是在不同尺度的特征特征图上采用卷积核来预测一系列Default Bounding Boxes的类别、坐标偏移。

2. 网络结构

以VGG-16为基础,使用VGG的前五个卷积,后面增加从CONV6开始的5个卷积结构,输入图片要求300*300

3. 流程

SSD中引入了Defalut Box,实际上与Faster R-CNN的anchor box机制类似,就是预设一些目标预选框,不同的是在不同尺度feature map所有特征点上是使用不同的prior boxes

3.1 detector & classifier

Detector&classifier的三个部分

1.default boxes:默认候选框

2.localization:4个位置偏移

3.confidence:21个类别置信度(要区分出背景)

3.2 default boxes

每个像素点生成3个候选框

ratio:长宽比

默认框的大小计算参数:s_min:最底层的特征图计算参数,s_max最顶层的特征图计算参数

3.4 localization与confidence

SSD的核心是在不同尺度的特征图上来进行Detector&classifier 容易使得SSD观察到更小的物体

4. 训练流程

输入->输出->结果与ground truth标记样本回归损失计算->反向传播,更新权值
1.样本标记:

利用anchor与对应的ground truth进行标记正负样本,每次并不训练8732张计算好的default boxes,先进行置信度筛选,并且训练指定的正样本和负样本,如下规则

  • 正样本
    1.与GT重合最高的boxes,其输出对应label设为对应物体,
    2.物体GT与anchor iou满足大于0.5设为正样本:
  • 其它的样本标记为负样本
    在训练时,default boxes按照正负样本控制positive:negative=1:3
    2.损失
    网络输出预测的predict box与ground truth回归变换之间的损失计算, 置信度是采用 Softmax Loss(FasterR-CNN是log loss),位置回归则是采用 Smooth L1loss(与Faster R-CNN一样)

5. 测试流程

出入-》输出-》nms-》输出

6. 总结

相关推荐
智驱力人工智能17 分钟前
小区高空抛物AI实时预警方案 筑牢社区头顶安全的实践 高空抛物检测 高空抛物监控安装教程 高空抛物误报率优化方案 高空抛物监控案例分享
人工智能·深度学习·opencv·算法·安全·yolo·边缘计算
qq_1601448721 分钟前
亲测!2026年零基础学AI的入门干货,新手照做就能上手
人工智能
Howie Zphile21 分钟前
全面预算管理难以落地的核心真相:“完美模型幻觉”的认知误区
人工智能·全面预算
人工不智能57724 分钟前
拆解 BERT:Output 中的 Hidden States 到底藏了什么秘密?
人工智能·深度学习·bert
盟接之桥26 分钟前
盟接之桥说制造:引流品 × 利润品,全球电商平台高效产品组合策略(供讨论)
大数据·linux·服务器·网络·人工智能·制造
kfyty72526 分钟前
集成 spring-ai 2.x 实践中遇到的一些问题及解决方案
java·人工智能·spring-ai
h64648564h44 分钟前
CANN 性能剖析与调优全指南:从 Profiling 到 Kernel 级优化
人工智能·深度学习
数据与后端架构提升之路1 小时前
论系统安全架构设计及其应用(基于AI大模型项目)
人工智能·安全·系统安全
忆~遂愿1 小时前
ops-cv 算子库深度解析:面向视觉任务的硬件优化与数据布局(NCHW/NHWC)策略
java·大数据·linux·人工智能
Liue612312311 小时前
YOLO11-C3k2-MBRConv3改进提升金属表面缺陷检测与分类性能_焊接裂纹气孔飞溅物焊接线识别
人工智能·分类·数据挖掘