YOLO系列算法解析

一、深度学习算法概述

1、不同阶段算法优缺点分析

One-stage:

优点:速度非常快,适合做实时监测任务

缺点:效果通常不好

2、yolo评价指标

yolo评价指标:map和fps
Map指标 :综合衡量检测效果

精度:识别准确率

召回率(recall):识别是否完全,有没有没有检测到的

TP:正确被检测到的

FP:错误被检测到的

FN:遗漏的
IOU:真实值与预测值的交集/真实值与预测值的并集

二、YOLOv1

1、特点

经典one-stage方法

把检测问题转换为回归问题,一个CNN就行

对视频进行实时检测

2、核心思想

输入S*S的格子,每个点产生两种候选框,切实有物体的点产生的候选框进行微调(置信度判断是否有物体),筛选出IOU大的

3、网络架构

7×7表示格子大小,30的含义:前5个是B1(x1,y1,w1,h1,c1),在5个表示B2,剩下20表示当前数据集有20个分类类别

三、YOLOv2

1、与V1的区别

V2版本舍弃了全连接层,不再使用DropOut,卷积之后全部加入Batch Normalization(网络每一层的输入都做了归一化,网络收敛更容易 Conv-BN),经过BN处理后网络提升2%的map

V2更大的分辨率:V1训练时用的是224×224的输入大小,测试用448×448,这样可能导致模型效率降低,V2训练时额外进行10次448×448的微调,使用高分辨率的的分类器后,map提升约4%

使用k-means聚类来提取先验框,这样对候选框大小不敏感,更适用于真实的数据集

通过引入Anchor boxes,使得预测的box数量更多,在基本不影响mAP的情况下,提高了大约7%的召回率

2、 网络结构



越大的感受野,越能感受大的物体。最后一层感受野太大,小目标可能就丢失了,需要融合之前的特征


四、YOLOv3

相较于之前的版本,最大的改进就是网络结构,使其更适合小目标检测

Darknet-53 没有池化,下采样通过stride为2来实现和全连接层

使用了resnet的思想,至少不比原来差

特征做的更细致,融合多持续特征图来预测不同规格物体

先验框更丰富,3种scale,每种3个规格,一共9种

softmax改进,预测多标签任务

相关推荐
飞翔的佩奇1 小时前
【完整源码+数据集+部署教程】食品分类与实例分割系统源码和数据集:改进yolo11-AggregatedAttention
python·yolo·计算机视觉·数据集·yolo11·食品分类与实例分割
Virgil1394 小时前
用PaddleDetection套件训练自己的数据集,PP-YOLO-SOD训练全流程
yolo
Coovally AI模型快速验证1 天前
YOLO、DarkNet和深度学习如何让自动驾驶看得清?
深度学习·算法·yolo·cnn·自动驾驶·transformer·无人机
程序猿小D2 天前
【完整源码+数据集+部署教程】孔洞检测系统源码和数据集:改进yolo11-RetBlock
yolo·计算机视觉·毕业设计·数据集·yolo11·孔洞检测
钓了猫的鱼儿3 天前
无人机航拍数据集|第14期 无人机水体污染目标检测YOLO数据集3000张yolov11/yolov8/yolov5可训练
yolo·目标检测·猫脸码客·yolo数据集·无人机航拍数据集·无人机水体污染目标检测
飞翔的佩奇4 天前
【完整源码+数据集+部署教程】武器目标检测系统源码和数据集:改进yolo11-AggregatedAtt
人工智能·python·yolo·目标检测·计算机视觉·数据集·yolo11
欣赏你流浪^5 天前
物联网智能感知进阶:基于YOLO的琏雾系统视频分析
物联网·yolo·音视频
cver1235 天前
人脸情绪检测数据集-9,400 张图片 智能客服系统 在线教育平台 心理健康监测 人机交互优化 市场研究与广告 安全监控系统
人工智能·安全·yolo·计算机视觉·目标跟踪·机器人·人机交互
ChironW5 天前
Ubuntu 22.04 离线环境下完整安装 Anaconda、CUDA 12.1、NVIDIA 驱动及 cuDNN 8.9.3 教程
linux·运维·人工智能·深度学习·yolo·ubuntu
雪可问春风5 天前
YOLOv8 训练报错:PyTorch 2.6+ 模型加载兼容性问题解决
人工智能·pytorch·yolo