Awesome-Backbones-main——alexnet模型分析

AlexNet作为骨干网络相对较老,可能在复杂数据集上的表现不如一些最新的深度网络结构,如ResNet、EfficientNet等,学习率调整策略中采用了阶梯式学习率更新器,可能并不总是适合所有数据集和模型,需要根据具体情况调整学习率策略。

模型参数:

  1. Backbone(骨干网络):

    • 类型:AlexNet
    • 输出类别数:4
  2. Neck:

    • 在配置中未指定,为None
  3. Head(头部):

    • 类型:ClsHead
    • 损失函数:
      • 类型:CrossEntropyLoss
      • 损失权重:1.0
  4. 数据处理:

    • 图像归一化参数:
      • 均值:[123.675, 116.28, 103.53]
      • 标准差:[58.395, 57.12, 57.375]
      • 是否转为RGB格式:True
  5. 训练参数:

    • 批量大小:8
    • 训练数据加载器的工作线程数:4
    • 是否使用预训练权重:False
    • 是否冻结特定层:False
    • 要冻结的层:('backbone',)
    • 训练周期数:100
  6. 测试参数:

    • 检查点路径:''
    • 评估指标:准确率、精确率、召回率、F1分数、混淆矩阵
    • 评估指标选项:
      • topk:(1, 2)
      • thrs:None
      • 平均模式:'none'
  7. 优化器参数:

    • 类型:SGD
    • 学习率:0.001
    • 动量:0.9
    • 权重衰减:1e-4
  8. 学习率调整配置:

    • 类型:StepLrUpdater
    • 调整步数:每15个周期调整一次学习率

图1:

让batch-size缩小一倍:

图2:

图二数据损失对比图一更加平滑,且下降梯度更大,速度更快,下降过程中方向调整更为敏感。

但在拟合过程中ACC全局波动更大

相关推荐
serve the people几秒前
TensorFlow 2.0 手写数字分类教程之SparseCategoricalCrossentropy 核心原理(一)
人工智能·分类·tensorflow
lovingsoft几秒前
复用的Vibe Coding 提示词模板(含原型 / MVP、CRUD、UI 组件、调试反馈 4 类场景)
人工智能·ui·敏捷开发
乾元8 分钟前
LLM 自动生成安全基线与等保合规初稿——把“网络工程事实”转译为“可审计的制度语言”
运维·网络·人工智能·python·安全·架构
Das19 分钟前
【计算机视觉】05_不变性
人工智能·计算机视觉
全栈陈序员10 分钟前
【Python】基础语法入门(二十四)——文件与目录操作进阶:安全、高效地处理本地数据
开发语言·人工智能·python·学习
跨境卫士情报站17 分钟前
摆脱砍单魔咒!Temu 自养号系统化采购,低成本高安全
大数据·人工智能·安全·跨境电商·亚马逊·防关联
OAK中国_官方18 分钟前
将Roboflow工作流引入OAK4:简化实时计算机视觉
人工智能·计算机视觉
吴爃20 分钟前
N8N调用系统接口进行AI分析
运维·人工智能·ai
老鱼说AI21 分钟前
经典论文精读第一期:DeepSeek-R1-Zero ——RL奇迹
人工智能·分布式·深度学习·神经网络·自然语言处理·nlp·transformer
思通数据21 分钟前
市政道路无人机巡检:AI视觉技术的应用与挑战
人工智能·深度学习·安全·目标检测·机器学习·无人机·语音识别