Awesome-Backbones-main——alexnet模型分析

AlexNet作为骨干网络相对较老,可能在复杂数据集上的表现不如一些最新的深度网络结构,如ResNet、EfficientNet等,学习率调整策略中采用了阶梯式学习率更新器,可能并不总是适合所有数据集和模型,需要根据具体情况调整学习率策略。

模型参数:

  1. Backbone(骨干网络):

    • 类型:AlexNet
    • 输出类别数:4
  2. Neck:

    • 在配置中未指定,为None
  3. Head(头部):

    • 类型:ClsHead
    • 损失函数:
      • 类型:CrossEntropyLoss
      • 损失权重:1.0
  4. 数据处理:

    • 图像归一化参数:
      • 均值:123.675, 116.28, 103.53
      • 标准差:58.395, 57.12, 57.375
      • 是否转为RGB格式:True
  5. 训练参数:

    • 批量大小:8
    • 训练数据加载器的工作线程数:4
    • 是否使用预训练权重:False
    • 是否冻结特定层:False
    • 要冻结的层:('backbone',)
    • 训练周期数:100
  6. 测试参数:

    • 检查点路径:''
    • 评估指标:准确率、精确率、召回率、F1分数、混淆矩阵
    • 评估指标选项:
      • topk:(1, 2)
      • thrs:None
      • 平均模式:'none'
  7. 优化器参数:

    • 类型:SGD
    • 学习率:0.001
    • 动量:0.9
    • 权重衰减:1e-4
  8. 学习率调整配置:

    • 类型:StepLrUpdater
    • 调整步数:每15个周期调整一次学习率

图1:

让batch-size缩小一倍:

图2:

图二数据损失对比图一更加平滑,且下降梯度更大,速度更快,下降过程中方向调整更为敏感。

但在拟合过程中ACC全局波动更大

相关推荐
学计算机的计算基12 小时前
2026 年 AI 助手三国杀:Claude Code vs 腾讯马维斯 vs MiniMax Mavis,我同时用了三周,结论很意外
java·人工智能·python·算法·langchain
_Aaron___12 小时前
Spring AI 应用上线前,先把大模型调用变成可观测链路
java·人工智能·spring
basketball61612 小时前
AI Infra 硬件体系与编程模型:6. Warp 调度器详解
人工智能
我有2只猫13 小时前
LabelStudio二次开发
人工智能·python·django·ocr
多年小白13 小时前
AI 日报 - 2026年6月7日
人工智能·量子计算
前端的阶梯13 小时前
如何节省你的token,请看CodeGraph
前端·人工智能·后端
升鲜宝供应链及收银系统源代码服务13 小时前
升鲜宝AI助手功能使用流程与数据库关联操作文档(三)---升鲜宝生鲜配送供应链管理系统源代码
人工智能·生鲜配送系统·生鲜物流线路规划·生鲜电商订单系统·生鲜供应链系统·生鲜系统架构设计·生鲜配送系统源代码服务出售
1892280486114 小时前
NV086固态MT29F16T08EWLCHD8-TES:C
大数据·服务器·人工智能·科技·缓存
古月开发14 小时前
本地化 AI 论文查重与润色工具部署指南
人工智能·自动化