AlexNet作为骨干网络相对较老,可能在复杂数据集上的表现不如一些最新的深度网络结构,如ResNet、EfficientNet等,学习率调整策略中采用了阶梯式学习率更新器,可能并不总是适合所有数据集和模型,需要根据具体情况调整学习率策略。
模型参数:
Backbone(骨干网络):
- 类型:AlexNet
- 输出类别数:4
Neck:
- 在配置中未指定,为None
Head(头部):
- 类型:ClsHead
- 损失函数:
- 类型:CrossEntropyLoss
- 损失权重:1.0
数据处理:
- 图像归一化参数:
- 均值:[123.675, 116.28, 103.53]
- 标准差:[58.395, 57.12, 57.375]
- 是否转为RGB格式:True
训练参数:
- 批量大小:8
- 训练数据加载器的工作线程数:4
- 是否使用预训练权重:False
- 是否冻结特定层:False
- 要冻结的层:('backbone',)
- 训练周期数:100
测试参数:
- 检查点路径:''
- 评估指标:准确率、精确率、召回率、F1分数、混淆矩阵
- 评估指标选项:
- topk:(1, 2)
- thrs:None
- 平均模式:'none'
优化器参数:
- 类型:SGD
- 学习率:0.001
- 动量:0.9
- 权重衰减:1e-4
学习率调整配置:
- 类型:StepLrUpdater
- 调整步数:每15个周期调整一次学习率
图1:
让batch-size缩小一倍:
图2:
图二数据损失对比图一更加平滑,且下降梯度更大,速度更快,下降过程中方向调整更为敏感。
但在拟合过程中ACC全局波动更大