YOLO v1(学习笔记)

1.YOLO 简介
(1)YOLO含义
  • YOLO 是 You Only Look Once 的缩写,意思是只看一眼就能检测出目标。
(2)一些概念
  • mAP (平均精度): mean Average Precision
2.YOLO v1
(1)原理(流程)
  • 第一步 图像分割 S×S :

  • 将图像分割为 S×S 个网格。若一个目标的中心落在某个网格中,那这个网格就负责来预测这个目标,比如下图:

  • 第二步 每个网格预测 B(一般取2) 个 bounding box 和 C 个类别的分数:

  • bounding box 包含5个参数4个位置参数x,y,w,h1个confidence值。其中x,y相对于小网格,w,h相对于整个图像的宽高,数值都在0~1,这四个参数用于预测bounding box的位置。

  • confidence = Pr(Object) × IOU。 Pr(Object)表示是否存在目标,存在取1,不存在取0。而IOU就是bounding box和真实目标框的交并比。所以confidence可以简单的理解为IOU。

  • eg:S=7,B=2,20个类别,那最后要预测 7×7×30 个参数。 S×S×(B×5+C)
  • 最后网络输出:

  • 每个向量可以看作对 对应网格 的预测值。

  • 第三步 目标概率 :

  • 我们可以看出,最后给出的目标概率,既包含了 它是某个目标的概率 ,也包含了边界框和真实边界框的重合程度

(2)网络结构
  • 标s-2表示步距为2,没标默认是1
(3)损失函数
  • 对于bounding box损失中,w和h使用根号的解释(下图):右边可以看出,对于小目标和大目标,预测框相对于真实框偏移相同长度,小目标的IOU应该更小一点,但是如果不用根号,那大小目标的IOU都一样了。
(4)YOLO v1 的问题
  • 对于小的群体性的目标预测很差
  • 当目标出现了新的尺寸或配置的时候,预测结果很差(YOLO v2 用anchor的方法解决)
相关推荐
knight_9___15 小时前
RAG面试篇8
人工智能·python·面试·agent·rag
Mr数据杨15 小时前
机载多光谱目标检测提升空中态势感知
人工智能·目标检测·机器学习·计算机视觉·数据分析·kaggle
郝学胜-神的一滴15 小时前
干货版《算法导论》 01:从问题定义到正确性证明
数据结构·人工智能·深度学习·神经网络·算法·机器学习
lizz66615 小时前
Hermes-Agent:钉钉dingtalk配置定时任务收集
人工智能·钉钉
MY_TEUCK15 小时前
【AI开发】从0到1写一个uni-app Vue3 小程序开发的Skill:用法、流程与踩坑复盘
人工智能·uni-app
ziuno15 小时前
01-语言模型+维特比
人工智能·语言模型·自然语言处理
nervermore99015 小时前
1. 人工智能学习-数学基础
人工智能
西西弗Sisyphus15 小时前
Transformer 嵌入层 nn.Embedding 到底是什么?
深度学习·transformer·embedding
NOCSAH15 小时前
统好 AI 驱动产业革新,以数智一体化实现高效经营
大数据·人工智能
上海锟联科技15 小时前
高速数据采集与信号生成一体化平台:基于 PCIe 3.0 的 250M/500M 同步解决方案
人工智能