锚框 与 完整YOLO示例(吴恩达深度学习笔记)

目录

[1.锚框(anchor box)](#1.锚框(anchor box))

(1)作用

(2)使用

(3)例子

[(4)anchor box形状的选择](#(4)anchor box形状的选择)

2.完整YOLO算法示例⭐

(1)训练卷积网络

(2)预测过程


1.锚框(anchor box)
(1)作用
  • anchor box用于从一个图像中检测多个对象
(2)使用
  • anchor box的思路是预先定义两个不同形状的anchor box,把预测结果和这两个anchor box关联起来。一般来说,你可能会用更多的anchor box,可能要5个甚至更多。
(3)例子
  • 可以发现图中有人和车两个对象,假设我们要检测这2个对象,就要预先定义两个不同形状的anchor box,此时y的类别标签不再是图中左下角的 y,而是重复2次,变为右边的 y
  • 前8个(上图中绿色方框标记的参数)是和anchor box 1关联的8个参数,后面的8个参数是和anchor box 2相关联。这下训练的识别卷积网络的输出就是3×3×16
(4)anchor box形状的选择
  • 人工指定形状:人工选择5到10个anchor box形状,覆盖到检测对象的多种不同形状,
  • k-平均算法(k-means)(YOLO算法中的):将几类对象形状聚类,如果我们用它来选择一组最具代表性的anchor box
2.完整YOLO算法示例⭐
  • 一个检测人,车,摩托的例子。
(1)训练卷积网络
  • 假设2个anchor box,图像分为3×3网格,所以网络输出为3×3×16。
(2)预测过程
  • 对于这个测试图像
  • 得到所有检测框:因为使用两个anchor box,那么对于9个格子中任何一个都会有两个预测框(注意有一些边界框可以超出所在格子的高度和宽度)
  • 然后抛弃概率很低的预测框:去掉这些连神经网络都说,这里很可能什么都没有,所以你需要抛弃这些。
  • 最后,非极大值抑制:有三个目标检测类别,人,汽车和摩托车,对于每个类别单独运行非极大值抑制,处理预测结果所属类别的边界框,运行三次来得到最终的预测结果。
相关推荐
笔画人生3 分钟前
# 探索 CANN 生态:深入解析 `ops-transformer` 项目
人工智能·深度学习·transformer
三水不滴6 分钟前
计网:输入网址到网页显示
经验分享·笔记·计算机网络
灰灰勇闯IT8 分钟前
领域制胜——CANN 领域加速库(ascend-transformer-boost)的场景化优化
人工智能·深度学习·transformer
小白狮ww12 分钟前
要给 OCR 装个脑子吗?DeepSeek-OCR 2 让文档不再只是扫描
人工智能·深度学习·机器学习·ocr·cpu·gpu·deepseek
island131427 分钟前
CANN GE(图引擎)深度解析:计算图优化管线、内存静态规划与异构任务的 Stream 调度机制
开发语言·人工智能·深度学习·神经网络
艾莉丝努力练剑27 分钟前
深度学习视觉任务:如何基于ops-cv定制图像预处理流程
人工智能·深度学习
禁默32 分钟前
大模型推理的“氮气加速系统”:全景解读 Ascend Transformer Boost (ATB)
人工智能·深度学习·transformer·cann
User_芊芊君子33 分钟前
CANN大模型加速核心ops-transformer全面解析:Transformer架构算子的高性能实现与优化
人工智能·深度学习·transformer
island13141 小时前
CANN ops-nn 算子库深度解析:神经网络核心计算的硬件映射、Tiling 策略与算子融合机制
人工智能·深度学习·神经网络
心疼你的一切1 小时前
数字智人:CANN加速的实时数字人生成与交互
数据仓库·深度学习·aigc·交互·cann