目标检测之YOLOv1

目录

  • [1. YOLOv1网络结构](#1. YOLOv1网络结构)
    • [1.1 网络结构](#1.1 网络结构)
    • [1.2 参数计算过程](#1.2 参数计算过程)
    • [1.3 参数列表和网络结构](#1.3 参数列表和网络结构)
  • [2. 模型输出结构解析](#2. 模型输出结构解析)
  • [3. 结果解析](#3. 结果解析)
    • [3.1 x,y,w,h](#3.1 x,y,w,h)
    • [3.2 置信度之IOU](#3.2 置信度之IOU)
    • [3.3 概率值](#3.3 概率值)
    • [3.4 模型输出结果](#3.4 模型输出结果)
    • [3.5 类别置信度](#3.5 类别置信度)
    • [3.6 非极大值抑制(NMS)](#3.6 非极大值抑制(NMS))
    • [3.7 后处理输出结果](#3.7 后处理输出结果)
  • [4. Yolov1损失函数](#4. Yolov1损失函数)
    • [4.1 坐标损失](#4.1 坐标损失)
    • [4.2 置信度损失](#4.2 置信度损失)
  • [5. 训练过程](#5. 训练过程)
  • [6. 总结](#6. 总结)

1. YOLOv1网络结构

1.1 网络结构

1.2 参数计算过程

其中计算输出宽高的公式如下:

OH=H+2P-FH/S + 1

OW=W+2P-FW/S + 1

其中P为padding值,FW为卷积核宽,S是卷积核移动步长

1.3 参数列表和网络结构

2. 模型输出结构解析

注意:这里每个小方格输出两个框,每个框数据包括(x,y,w,h,c)再加上20个分类的概率=30

3. 结果解析

3.1 x,y,w,h

3.2 置信度之IOU

IOU=标注框/预测框

IOU越大预测与标注越接近

置信度

3.3 概率值

7x7个框,每个框对应20个类别的概率,每个小框有2个候选框,它们共用20个类别的概率

3.4 模型输出结果

输出49x2个检测框,每个小框有30维向量

3.5 类别置信度

3.6 非极大值抑制(NMS)

3.7 后处理输出结果

4. Yolov1损失函数

S=7,7x7个小方格

B=2,没个小方格有两个预测框

4.1 坐标损失

计算wh的时候增加了根号,是由于小物体看起来误差会大一些,大物体会小一些,但是由于小物体的值更小,使得计算出来的误差值比大物体还小,为了解决这样的问题,加上根号再计算,放大小物体的误差,抑制大物体的误差

4.2 置信度损失

5. 训练过程

先训练分类模型再训练检测模型,原因可能是由于当时算力的限制

6. 总结

小物体检测差的原因是,7x7个框,每个框有两个预测框,还共享概率,那么比如小方块中有3个以上小物体,那么一个预测概率只能识别出一个小物体,其他的就漏检了。

检测目标较少的原因是7x7x2=98,2个预测框还公用一个概率因此最多检测出49个目标,当目标多余49个时,就会出现漏检了。

相关推荐
向哆哆6 天前
高精度织物缺陷检测数据集(适用YOLO系列/1000+标注)(已标注+划分/可直接训练)
yolo·目标检测
前网易架构师-高司机6 天前
带标注的驾驶员安全带识别数据集,识别率99.5%,可识别有无系安全带,支持yolo,coco json,pascal voc xml格式
xml·yolo·数据集·交通·安全带
向哆哆7 天前
粉尘环境分类检测千张图数据集(适用YOLO系列)(已标注+划分/可直接训练)
yolo·分类·数据挖掘
琅琊榜首20207 天前
移动端AI挂机新范式:YOLOv8+NCNN实现无Root视觉自动化
人工智能·yolo·自动化
智驱力人工智能7 天前
地铁隧道轨道障碍物实时检测方案 守护城市地下动脉的工程实践 轨道障碍物检测 高铁站区轨道障碍物AI预警 铁路轨道异物识别系统价格
人工智能·算法·yolo·目标检测·计算机视觉·边缘计算
智驱力人工智能7 天前
机场鸟类活动智能监测 守护航空安全的精准工程实践 飞鸟检测 机场鸟击预防AI预警系统方案 机场停机坪鸟类干扰实时监测机场航站楼鸟击预警
人工智能·opencv·算法·安全·yolo·目标检测·边缘计算
前端摸鱼匠8 天前
YOLOv8使用 Ultralytics 内置功能简化格式转换:介绍如何使用 yolo mode=data 等相关功能或辅助工具来加速和简化数据格式的准备工作
人工智能·yolo·目标检测·机器学习·目标跟踪·视觉检测
hans汉斯8 天前
《数据挖掘》期刊推介&征稿指南
图像处理·人工智能·算法·yolo·数据挖掘·超分辨率重建·汉斯出版社
卓越软件开发8 天前
毕设全栈开发一条龙:Java/SpringBoot/Vue/ 小程序 / Python / 安卓 / AI 图像识别 人脸检测 车牌识别 YOLO
开发语言·spring boot·python·yolo·小程序·毕业设计·课程设计
向哆哆8 天前
单车/共享单车目标检测数据集(适用YOLO系列)(已标注+划分/可直接训练)
人工智能·yolo·目标检测