YOLO v1(学习笔记)

1.YOLO 简介
(1)YOLO含义
  • YOLO 是 You Only Look Once 的缩写,意思是只看一眼就能检测出目标。
(2)一些概念
  • mAP (平均精度): mean Average Precision
2.YOLO v1
(1)原理(流程)
  • 第一步 图像分割 S×S :

  • 将图像分割为 S×S 个网格。若一个目标的中心落在某个网格中,那这个网格就负责来预测这个目标,比如下图:

  • 第二步 每个网格预测 B(一般取2) 个 bounding box 和 C 个类别的分数:

  • bounding box 包含5个参数4个位置参数x,y,w,h1个confidence值。其中x,y相对于小网格,w,h相对于整个图像的宽高,数值都在0~1,这四个参数用于预测bounding box的位置。

  • confidence = Pr(Object) × IOU。 Pr(Object)表示是否存在目标,存在取1,不存在取0。而IOU就是bounding box和真实目标框的交并比。所以confidence可以简单的理解为IOU。

  • eg:S=7,B=2,20个类别,那最后要预测 7×7×30 个参数。 S×S×(B×5+C)
  • 最后网络输出:

  • 每个向量可以看作对 对应网格 的预测值。

  • 第三步 目标概率 :

  • 我们可以看出,最后给出的目标概率,既包含了 它是某个目标的概率 ,也包含了边界框和真实边界框的重合程度

(2)网络结构
  • 标s-2表示步距为2,没标默认是1
(3)损失函数
  • 对于bounding box损失中,w和h使用根号的解释(下图):右边可以看出,对于小目标和大目标,预测框相对于真实框偏移相同长度,小目标的IOU应该更小一点,但是如果不用根号,那大小目标的IOU都一样了。
(4)YOLO v1 的问题
  • 对于小的群体性的目标预测很差
  • 当目标出现了新的尺寸或配置的时候,预测结果很差(YOLO v2 用anchor的方法解决)
相关推荐
Mintopia1 小时前
Gemini 的发展之道:从多模态模型演进到工程化落地的技术路径
人工智能
洞见前行1 小时前
AI Agent 的外部连接层:MCP 协议原理、机制设计与实战开发
人工智能
陈广亮1 小时前
当 AI Agent 学会付钱:x402 协议与 Agent 支付基础设施全解析
人工智能
廋到被风吹走1 小时前
持续学习方向 AI工程化(TensorFlow Serving、MLflow)
人工智能·学习·tensorflow
Once_day1 小时前
AI实践(0)学习路线
人工智能·学习·ai实践
数据与后端架构提升之路1 小时前
论大模型应用架构(RAG/Agent)的设计与应用——以自动驾驶数据闭环平台为例
人工智能·架构·自动驾驶
ccLianLian1 小时前
LLM·Agent
人工智能
xinxiangwangzhi_1 小时前
立体匹配--深度学习方法综述(1)
人工智能·深度学习·计算机视觉
九河云1 小时前
数据上云的安全边界:零信任架构在混合云场景的应用
大数据·人工智能·安全·架构·数字化转型