yolo系列模型详解-yolov5

1. yolov5的模型结构

yolov5s, yolov5m, yolov5l, yolov5x, 它们通过深度depth和宽度width两个控制因子来缩放

核心架构:输入端input、骨干网络backbone、颈部neck、检测头head。

输入端input:

对训练和推理友好的策略:

Mosaic数据增强:

数据增广策略,随机将4张训练图片,通过随机缩放、裁剪、排布的方式拼接成一张新的图片。丰富背景和小目标、提高训练效率。

自适应锚框计算:

训练时,会基于你传入的数据集标签,自动重新计算预设的锚框Anchor Boxes尺寸。这保证了模型一开始就有针对特定数据集的、较好的先验框,从而加速收敛。

自适应图片缩放:

在推理阶段,yolov5会将图片缩放到标准尺寸,如640x640。为了减少黑边带来的计算冗余,它会采用一种"letterbox"的自适应缩放技术,通过计算最小缩放比例,并对长宽进行补边,尽可能地保持图像原始比例,减少信息丢失。

骨干网络Backbone:

主要用于从输入图像中提取丰富的特征。它是在CSPNet(Cross Stage Partial Network)思想的基础上构建的,称为CSPDarkNet。

Focus结构(在V6.0版本后被简化):

在早期的V5版本中,第一个模块是Focus。它通过将输入图像的像素切片,每隔一个像素取一个值,得到4个独立的特征层,然后将它们拼接起来。这个过程将信息从宽度和高度维度集中到了通道维度,没有信息丢失,但计算量相对较大。

在V6.0及以后的版本中,Focus层被一个更简洁、高效的6x6卷积层所替代。这个改动简化了模型结构,并且利用现代GPU和计算库对卷积的优化,获得了更好的速度和精度平衡。

CSPNet结构(C3/C2f模块):

2. yolov5的优化点

3. yolov5的损失函数

4. yolov5的超参数

5. yolov5训练时针对于样本不均衡可以怎么解决

6. yolov5训练时基于小目标可以怎么解决

7. yolov5的推理优化,可以从哪些方面做

相关推荐
探物 AI3 小时前
把 MambaOut 塞进 YOLOv11:会有什么样的反应
python·yolo·计算机视觉
快乐得小萝卜13 小时前
部署:YOLO V11 TensorRT 推理&前后处理
yolo
断眉的派大星13 小时前
YOLO26 完整学习笔记:从 Anchor-Free、TAL、STAL 到端到端无 NMS 部署
人工智能·笔记·学习·yolo·目标检测·计算机视觉·目标跟踪
stsdddd16 小时前
YOLO系列目标检测数据集大全【第十三期】
yolo·目标检测·目标跟踪
动物园猫17 小时前
无人机战场侦察6类军事目标检测数据集分享(适用于YOLO系列深度学习分类检测任务)
yolo·目标检测·无人机
羊羊小栈2 天前
老人摔倒检测系统(基于YOLO姿态估计)
yolo·毕业设计·创业创新·大作业
土星云SaturnCloud2 天前
土星云AI边缘计算SE110S系列模型部署实战-YOLOv5
服务器·人工智能·yolo·docker·边缘计算
YOLO数据集集合2 天前
配电站智能运维|变电一次设备识别|高压电气构件目标检测数据集|电力巡检
运维·人工智能·深度学习·yolo·目标检测·视觉检测
stsdddd3 天前
YOLO系列目标检测数据集大全【第八期】
yolo·目标检测·目标跟踪
YOLO数据集集合3 天前
航拍输电线路故障识别|线路金具缺陷判别|无人机电力巡检故障检测数据集10262期
人工智能·深度学习·yolo·目标检测·视觉检测·无人机