城市管理违规行为智能识别 Task3学习心得

本次学习主要针对数据集增强和模型预测

1、数据增强:

1)将四张训练图像组合成一张,增加物体尺度和位置的多样性。

2)复制一个图像的随机区域并粘贴到另一个图像上,生成新的训练样本

3)图像的随机旋转、缩放、平移和剪切,增加对几何变换的鲁棒性

4)通过线性组合两张图像及其标签创造合成图像,增加特征空间的泛化

5)一个支持多种增强技术的图像增强库,提供灵活的增强管道定义

6)对图像的色相、饱和度和亮度进行随机变化,改变颜色属性

7)沿水平轴随机翻转图像,增加对镜像变化的不变性。

比起我之前做的分类分割任务,yolo这边的数据增强用了更多的方法,我一般只用3、5、7,yolo还多了很多图片组合来增强数据

2、设置训练参数:

imgsz: 训练时的目标图像尺寸,所有图像在此尺寸下缩放。(这个我用高分辨率试了,效果相对好一点)

save_period: 保存模型检查点的频率(周期数),-1 表示禁用。

device: 用于训练的计算设备,可以是单个或多个 GPU,CPU 或苹果硅的 MPS。(不用管) optimizer: 训练中使用的优化器,如 SGD、Adam 等,或 'auto' 以根据模型配置自动选择。(这个我直接用Adam,感觉是最通用的)

momentum: SGD 的动量因子或 Adam 优化器的 beta1。

weight_decay: L2 正则化项。

warmup_epochs: 学习率预热的周期数。

warmup_momentum: 预热阶段的初始动量。

warmup_bias_lr: 预热阶段偏置参数的学习率。

box: 边界框损失在损失函数中的权重。

cls: 分类损失在总损失函数中的权重。

dfl: 分布焦点损失的权重。

后面基本上都没有管,怕越调越差

3、YOLO 模型预测行为和性能

|---------|-------------|-------|-------------------------------------------------------------------------------|
| 参数名 | 类型 | 默认值 | 描述 |
| conf | float | 0.25 | 置信度阈值,用于设置检测对象的最小置信度。低于此阈值的检测对象将被忽略。调整此值有助于减少误报。 |
| iou | float | 0.7 | 非最大值抑制(NMS)的交并比(IoU)阈值。较低的值通过消除重叠的边界框来减少检测数量,有助于减少重复项。 |
| imgsz | int 或 tuple | 640 | 推理时定义图像的大小。可以是单个整数(如640),用于将图像大小调整为正方形,或(height, width)元组。合适的尺寸可以提高检测精度和处理速度。 |
| augment | bool | FALSE | 启用预测时的数据增强(TTA),可能通过牺牲推理速度来提高检测的鲁棒性。 |

除了imgs之外我都没管,设置为1024


本次实验完成后效果不太好,上一次的Task2可以跑到0.08,而这两次同样使用yolov8x只跑出来0.006,调整的参数主要在数据增强

又调了几次,都卡在一样的值了,不知道哪里出了问题

相关推荐
水如烟28 分钟前
孤能子视角:“组织行为学–组织文化“
人工智能
大山同学32 分钟前
图片补全-Context Encoder
人工智能·机器学习·计算机视觉
薛定谔的猫198244 分钟前
十七、用 GPT2 中文对联模型实现经典上联自动对下联:
人工智能·深度学习·gpt2·大模型 训练 调优
壮Sir不壮1 小时前
2026年奇点:Clawdbot引爆个人AI代理
人工智能·ai·大模型·claude·clawdbot·moltbot·openclaw
PaperRed ai写作降重助手1 小时前
高性价比 AI 论文写作软件推荐:2026 年预算友好型
人工智能·aigc·论文·写作·ai写作·智能降重
玉梅小洋1 小时前
Claude Code 从入门到精通(七):Sub Agent 与 Skill 终极PK
人工智能·ai·大模型·ai编程·claude·ai工具
-嘟囔着拯救世界-1 小时前
【保姆级教程】Win11 下从零部署 Claude Code:本地环境配置 + VSCode 可视化界面全流程指南
人工智能·vscode·ai·编辑器·html5·ai编程·claude code
正见TrueView1 小时前
程一笑的价值选择:AI金玉其外,“收割”老人败絮其中
人工智能
Imm7771 小时前
中国知名的车膜品牌推荐几家
人工智能·python
风静如云2 小时前
Claude Code:进入dash模式
人工智能