昇思第16天

SSD目标检测

模型简介

SSD (Single Shot MultiBox Detector) 是 Wei Liu 在 ECCV 2016 上提出的一种目标检测算法。使用 Nvidia Titan X 在 VOC 2007 测试集上,SSD 对于输入尺寸 300x300 的网络,达到 74.3% mAP 和 59 FPS;对于 512x512 的网络,达到 76.9% mAP,超越当时最强的 Faster RCNN (73.2% mAP)。

目标检测算法可以分为两种类型:

  1. Two-stage 方法:RCNN 系列,通过算法产生候选框,然后再对这些候选框进行分类和回归。
  2. One-stage 方法:YOLO 和 SSD,直接通过主干网络给出类别位置信息,不需要区域生成。

SSD 采用卷积神经网络进行特征提取,通过多尺度的特征层进行检测输出,预设不同长宽比例的 anchor,每一个输出特征层基于 anchor 预测多个检测框。

模型结构

SSD 采用 VGG16 作为基础模型,然后在其基础上新增了卷积层以获得更多的特征图用于检测。SSD 利用多尺度特征图进行检测,不同于 YOLO,SSD 是通过卷积得到最后的边界框,而 YOLO 通过全连接形式得到一维向量。

模型特点
  • 多尺度检测:浅层检测小目标,深层检测大目标。
  • anchor 策略:预设不同比例的 anchor,进行多框检测。
  • 卷积实现检测:通过卷积层直接输出检测结果。
数据集和预处理

使用 VOC2012 数据集进行训练,进行数据增强和图像预处理,调整图像尺寸并标准化。

模型训练

训练时设置 epoch 次数为 60,batch_size 为 5,图像尺寸为 300x300。使用位置损失函数和置信度损失函数的加权和作为损失函数,优化器为 Momentum,初始学习率为 0.001。每训练 10 个 epoch 保存一次模型。

评估

使用自定义的 eval_net() 类对训练好的模型进行评估,计算在不同 IoU 阈值、area 和 maxDets 设置下的 AP 和 AR。使用 COCO Metrics 类计算 mAP。模型在测试集上的评估指标包括 mAP、IoU 等。

精确率和召回率
  • TP:IoU > 阈值的检测框数量
  • FP:IoU <= 阈值的检测框数量或多余检测框数量
  • FN:未检测到的 GT 数量

AP 和 AR 的计算公式分别为:

  • AP:正样本预测正确结果与正样本预测总结果的比值。
  • AR:正样本预测正确结果与正样本实际数量的比值。
训练输出指标
  • mAP:各类别 AP 的平均值
  • IoU=0.5 的 mAP:反映算法框的位置精准程度
  • AR:检出率,反映模型的检测性能
相关推荐
河南博为智能科技有限公司9 分钟前
RS485转以太网串口服务器-串口设备联网的理想选择
大数据·服务器·人工智能·单片机·嵌入式硬件·物联网
算家计算23 分钟前
英伟达谷歌打响“太空算力争夺战”,下一战场竟是星辰大海?
人工智能·芯片·资讯
HyperAI超神经40 分钟前
在线教程丨端侧TTS新SOTA!NeuTTS-Air基于0.5B模型实现3秒音频克隆
人工智能·深度学习·机器学习·音视频·tts·音频克隆·neutts-air
wwwzhouhui43 分钟前
2025年11月1日-AI 驱动教学革命:3 分钟生成专业级动画课件,还能导出视频 GIF!
人工智能·音视频·ai动画教学
国科安芯1 小时前
抗辐照MCU芯片在无人叉车领域的性能评估与选型建议
网络·人工智能·单片机·嵌入式硬件·安全
用户5191495848451 小时前
原型污染攻击工具揭秘:Prototype Pollution Gadgets Finder
人工智能·aigc
躺平的赶海人1 小时前
Halcon实战:精准定位与提取:基于形态学处理的猴子眼睛区域检测完整方案
图像处理·计算机视觉·halcon·形态学操作
VXHAruanjian8881 小时前
以智促效,释放创新力量,RPA助力企业全面自动化变革
大数据·人工智能
Godspeed Zhao1 小时前
自动驾驶中的传感器技术76——Navigation(13)
人工智能·机器学习·自动驾驶
CoovallyAIHub1 小时前
首届AI交易大赛对决!中国模型包揽冠亚军,GPT-5亏损62%垫底
人工智能·google·数据分析