yolov3学习之训练原理

1 多任务损失函数设计

YOLOv3 是一个单阶段、多尺度、多任务的目标检测器。其训练目标可分解为三个子任务:

总损失函数为三者的加权和:

其中权重 λ通常来自超参数配置(如 hyp.scratch.yaml 中 box=0.05, obj=1.0, cls=0.5)。

2 损失函数(复合损失)

YOLOv3 的总损失由三部分加权组成:

(1)边界框坐标损失(Location Loss)

早期版本用 MSE,后续改进常用 CIoU Loss 或 GIoU Loss;

考虑重叠面积、中心点距离、宽高比,提升定位精度。

(2) 置信度损失(Confidence Loss)

对有目标的框(正样本)和无目标的框(负样本)分别计算;

使用 二元交叉熵(BCE);

可引入 Focal Loss 缓解正负样本不平衡。

(3)分类损失(Classification Loss)

对每个预测框,独立计算 80 个类别的 BCE;

使用 sigmoid 而非 softmax,支持多标签(如"猫"和"动物"可同时为真)。

注意:只有 负责预测某真实目标的锚框 才参与分类和坐标损失计算(基于 IoU 最大匹配原则)。

3 多尺度输出与损失分配

YOLOv3 通过 FPN 结构输出 3 个尺度的特征图:

P3/8: 8倍下采样 → 52×52特征图 → 检测小目标

P4/16: 16倍下采样 → 26×26特征图 → 检测中目标

P5/32: 32倍下采样 → 13×13特征图 → 检测大目标

每个尺度使用 3 个预定义锚框(anchor),共 9 个。

训练时:

对每个真实框(GT),选择 IoU 最大的 anchor 所在的尺度,仅该位置、该 anchor 的预测参与 box 和 cls 损失计算,其他位置作为负样本参与 obj 损失(若 IoU < ignore_thresh)。

这种"正样本稀疏分配"机制大幅减少无效梯度干扰。

4 训练策略与技巧

输入尺寸:通常为 416×416(可多尺度训练,如 320~608 随机调整);

YOLOv3训练使用了:

混合精度训练(AMP)

梯度累积

多尺度训练(可选)

标签平滑(可选)

5 关键问题:叠加损失会显著增加计算量吗?

答案:不会。计算量几乎不变,但显存略有增加。

为什么计算量不增加?

前向传播只执行一次:模型推理(Darknet53 + FPN)是主要开销,与损失数量无关

反向传播路径共享:多个损失的梯度在共享节点(如 backbone 输出)自动累加,后续反向只需一次。

损失函数本身极轻量:BCE/CIoU 等操作 FLOPs 可忽略(<0.5% 总计算量)。

也就是说在共享节点( backbone)之前是要同时在3个方向做反向传播,但是在共享节点( backbone)之后就一次反向传播了------这和数学链式求梯度有关。

核心机制:自动微分(Autograd)利用梯度线性性,将多损失反向转化为单次图遍历 + 梯度累加。

GPU显存和CPU开销什么会增加?

GPU 显存:需保留更多中间激活值供反向使用(约 +10%)。

少量 CPU 开销:标签匹配、IoU 计算等(通常非瓶颈)。

实测表明:三损失 vs 单损失,训练速度差异通常 < 5%。

相关推荐
IT_陈寒20 分钟前
JavaScript里这个隐式类型转换的坑,我终于爬出来了
前端·人工智能·后端
星幻元宇VR24 分钟前
VR航空航天科普设备助力航天知识普及
人工智能·科技·学习·安全·vr·虚拟现实
Agent产品评测局27 分钟前
制造业生产调度自动化落地,完整步骤与避坑指南:2026企业级智能体选型与实战全景
运维·人工智能·ai·chatgpt·自动化
志栋智能1 小时前
超自动化巡检:让合规与审计变得轻松简单
运维·网络·人工智能·自动化
用户1708542888851 小时前
用 Codex + Huashu Design Skill,15 分钟做出设计师级别的演示文稿(PPT)
人工智能
Elastic 中国社区官方博客1 小时前
Elasticsearch:智能搜索 - AI builder 及 skills
大数据·人工智能·elasticsearch·搜索引擎·ai·信息可视化·全文检索
陶陶然Yay1 小时前
神经网络卷积层梯度公式推导
人工智能·深度学习·神经网络
luffy54592 小时前
spring-ai实现rag本地知识库
人工智能
阿里云大数据AI技术2 小时前
Agentic风控:Flink+Fluss+大模型构建Agent全链路风险感知与实时告警
人工智能·flink
用户79457223954132 小时前
一句话生成短视频:当 AI Skills 真正打通"创作流水线"
人工智能·github·ai编程