yolo笔记

目录

输入端

参考:https://zhuanlan.zhihu.com/p/172121380

Mosaic数据增强

随机的仿射变换

数据增强Copy-paste

有分割数据集时

数据增强- MixUp

按一定的透明程度混合生成一张图片;

数据增强- Albumentations

参考:https://blog.csdn.net/weixin_45942927/article/details/124529291

空域滤波

为图像平滑(去噪声)和图像锐化(突出轮廓)

均值滤波:图像去噪的同时也破坏了图像的细节部分

中值滤波:可以保护图像尖锐的边缘,选择适当的点来替代污染点的值,所以处理效果好,对椒盐噪声表现较好,对高斯噪声表现较差。

直方图均衡化

可提高图像的对比度

以及改变图片质量等等

数据增强- Augment HSV (Hue, Saturation, Value)色度、饱和度、浓度

数据增强- Random horizontal flip

随机水平翻转

自适应锚框计算

自适应图片缩放

Backbone

Focus结构

将Focus模块替换成了6x6的普通卷积层。

两者功能相同,但后者效率更高。

CSP结构

CSP结构

Neck

损失函数


小目标

中等目标

大目标

小型目标更难预测,所以将小型目标的超参设置大一些

参考:https://zhuanlan.zhihu.com/p/143747206

IOU_Loss

当预测框和目标框不相交时,IOU=0,无法反应两个框距离的远近,此时损失函数不可导,IOU_Loss无法优化两个框不相交的情况。

GIOU_Loss


DIOU_Loss


CIOU_loss

训练策略

➢Multi-scale training(0.5~1.5x) 320大小图片会缩放为0.5到1.5倍

➢AutoAnchor(For training custom data)

➢Warmup and Cosine LR scheduler

学习率从一个非常小的值慢慢增长到设置的初始的学习率

用cos的方法去降低学习率

➢EMA(Exponential Moving Average)

将学习率加上一个动量

➢Mixed precision

混合精度训练

➢Evolve hyper- parameters

消除Grid敏感度


梯度爆炸

匹配正样本

anchor_t最大为4(缩放因子设置为0~4)

在0.25~4的区间内就算匹配成功

相关推荐
疯狂打码的少年14 分钟前
【程序语言与编译】NFA转DFA(子集构造法)
前端·笔记
咸甜适中24 分钟前
rust语言学习笔记Trait(十七)Send、Sync(线程间数据所有权)
笔记·学习·rust
尘汐筠竹36 分钟前
Day1-2 学习笔记:在 AMD 云环境上部署 Gemma 4 大模型
笔记·学习·datawhale·amdev
逸模1 小时前
逸模 VS CAD+SU系列(三)工程量---逸模模型级智能算量,数据同源闭环 助力公装项目精准控本高效拓店
人工智能·笔记·算量·公装·构件库
zhangrelay1 小时前
个体智能大模型使用的主观数据复盘-节选-2026-
笔记·学习·课程设计
lunzi_08261 小时前
【学习笔记】《Python编程 从入门到实践》第9章:类、继承、组合与面向对象编程
笔记·python·学习
神明不懂浪漫1 小时前
【第二章】Java中的数据类型,运算符与程序逻辑控制
java·开发语言·经验分享·笔记
05候补工程师2 小时前
【408考研复习】数据结构核心笔记:字符串模式匹配与内部排序算法全解析
数据结构·经验分享·笔记·考研·算法·排序算法
问心无愧05132 小时前
ctf show web入门107
android·前端·笔记·android studio
chase。2 小时前
【学习笔记】面向机器人食物舀取的 spillage-aware 引导扩散策略
笔记·学习·机器人