yolo系列模型详解-yolov5

1. yolov5的模型结构

yolov5s, yolov5m, yolov5l, yolov5x, 它们通过深度depth和宽度width两个控制因子来缩放

核心架构:输入端input、骨干网络backbone、颈部neck、检测头head。

输入端input:

对训练和推理友好的策略:

Mosaic数据增强:

数据增广策略,随机将4张训练图片,通过随机缩放、裁剪、排布的方式拼接成一张新的图片。丰富背景和小目标、提高训练效率。

自适应锚框计算:

训练时,会基于你传入的数据集标签,自动重新计算预设的锚框Anchor Boxes尺寸。这保证了模型一开始就有针对特定数据集的、较好的先验框,从而加速收敛。

自适应图片缩放:

在推理阶段,yolov5会将图片缩放到标准尺寸,如640x640。为了减少黑边带来的计算冗余,它会采用一种"letterbox"的自适应缩放技术,通过计算最小缩放比例,并对长宽进行补边,尽可能地保持图像原始比例,减少信息丢失。

骨干网络Backbone:

主要用于从输入图像中提取丰富的特征。它是在CSPNet(Cross Stage Partial Network)思想的基础上构建的,称为CSPDarkNet。

Focus结构(在V6.0版本后被简化):

在早期的V5版本中,第一个模块是Focus。它通过将输入图像的像素切片,每隔一个像素取一个值,得到4个独立的特征层,然后将它们拼接起来。这个过程将信息从宽度和高度维度集中到了通道维度,没有信息丢失,但计算量相对较大。

在V6.0及以后的版本中,Focus层被一个更简洁、高效的6x6卷积层所替代。这个改动简化了模型结构,并且利用现代GPU和计算库对卷积的优化,获得了更好的速度和精度平衡。

CSPNet结构(C3/C2f模块):

2. yolov5的优化点

3. yolov5的损失函数

4. yolov5的超参数

5. yolov5训练时针对于样本不均衡可以怎么解决

6. yolov5训练时基于小目标可以怎么解决

7. yolov5的推理优化,可以从哪些方面做

相关推荐
山半仙xs3 小时前
pointNet做点云的分割和分类
人工智能·yolo·分类·自动驾驶·视觉检测
7yewh12 小时前
jetson_yolo_deployment 01_linux_dev_env
linux·嵌入式硬件·yolo·机器人·嵌入式
小趴蔡ha21 小时前
如何将XML格式标注文件转换为YOLO格式进行目标检测训练(附代码)
xml·yolo·目标检测
彭祥.1 天前
基于PaddleSeg与YOLO的自动标注工具
yolo·paddle
白宇横流学长1 天前
基于 YOLO 的宠物识别系统的设计与实现设计与实现【源码+文档】
yolo·宠物
7yewh2 天前
jetson_yolo_deployment 02_linux_dev_skills
linux·python·嵌入式硬件·yolo·嵌入式
极智视界2 天前
目标检测数据集 - 汽车损坏检测数据集下载
yolo·目标检测·数据集·voc·coco·算法训练·汽车外观损坏检测
kisshuan123962 天前
DRFD深度感受野下采样改进YOLOv26三路径特征融合
yolo
ASD123asfadxv2 天前
倒残差移动块与滑动窗口注意力改进YOLOv26局部感知与全局建模双重突破
人工智能·yolo·目标跟踪