YOLO v1(学习笔记)

1.YOLO 简介
(1)YOLO含义
  • YOLO 是 You Only Look Once 的缩写,意思是只看一眼就能检测出目标。
(2)一些概念
  • mAP (平均精度): mean Average Precision
2.YOLO v1
(1)原理(流程)
  • 第一步 图像分割 S×S :

  • 将图像分割为 S×S 个网格。若一个目标的中心落在某个网格中,那这个网格就负责来预测这个目标,比如下图:

  • 第二步 每个网格预测 B(一般取2) 个 bounding box 和 C 个类别的分数:

  • bounding box 包含5个参数4个位置参数x,y,w,h1个confidence值。其中x,y相对于小网格,w,h相对于整个图像的宽高,数值都在0~1,这四个参数用于预测bounding box的位置。

  • confidence = Pr(Object) × IOU。 Pr(Object)表示是否存在目标,存在取1,不存在取0。而IOU就是bounding box和真实目标框的交并比。所以confidence可以简单的理解为IOU。

  • eg:S=7,B=2,20个类别,那最后要预测 7×7×30 个参数。 S×S×(B×5+C)
  • 最后网络输出:

  • 每个向量可以看作对 对应网格 的预测值。

  • 第三步 目标概率 :

  • 我们可以看出,最后给出的目标概率,既包含了 它是某个目标的概率 ,也包含了边界框和真实边界框的重合程度

(2)网络结构
  • 标s-2表示步距为2,没标默认是1
(3)损失函数
  • 对于bounding box损失中,w和h使用根号的解释(下图):右边可以看出,对于小目标和大目标,预测框相对于真实框偏移相同长度,小目标的IOU应该更小一点,但是如果不用根号,那大小目标的IOU都一样了。
(4)YOLO v1 的问题
  • 对于小的群体性的目标预测很差
  • 当目标出现了新的尺寸或配置的时候,预测结果很差(YOLO v2 用anchor的方法解决)
相关推荐
2501_9209538628 分钟前
工业4.0时代,制造企业精益管理咨询的标准化实施步骤
大数据·人工智能·制造
~央千澈~42 分钟前
《2026鸿蒙NEXT纯血开发与AI辅助》第四章 对鸿蒙next项目结构目录详解以及实战解决一个最初的依赖安装的报错·卓伊凡
人工智能
xinlianyq1 小时前
2026企业流量破局:四大主流短视频矩阵获客系统深度解析与选型指南
人工智能·矩阵
workflower2 小时前
用硬件换时间”与“用算法降成本”之间的博弈
人工智能·算法·安全·集成测试·无人机·ai编程
AI人工智能+3 小时前
施工许可证识别技术:深度融合计算机视觉(CV)与自然语言处理(NLP)
深度学习·计算机视觉·ocr·施工许可证识别
Cx330❀3 小时前
一文吃透Linux System V共享内存:原理+实操+避坑指南
大数据·linux·运维·服务器·人工智能
OPHKVPS3 小时前
Anthropic 为 Claude Code 推出“自动模式”:AI 编码工具迈向更高自主性
网络·人工智能·安全·ai
Allen_LVyingbo3 小时前
斯坦福HAI官网完整版《2025 AI Index Report》全面解读
人工智能·数学建模·开源·云计算·知识图谱
金融小师妹3 小时前
基于AI通胀预期建模与能源冲击传导机制的政策分析:高频信号下的风险再评估
人工智能·svn·能源
胡摩西3 小时前
当大模型遇上毫米级定位:机器人将拥有“空间思维”?
人工智能·机器人·slam·gps·室内定位·roomaps