Awesome-Backbones-main——alexnet模型分析

AlexNet作为骨干网络相对较老,可能在复杂数据集上的表现不如一些最新的深度网络结构,如ResNet、EfficientNet等,学习率调整策略中采用了阶梯式学习率更新器,可能并不总是适合所有数据集和模型,需要根据具体情况调整学习率策略。

模型参数:

  1. Backbone(骨干网络):

    • 类型:AlexNet
    • 输出类别数:4
  2. Neck:

    • 在配置中未指定,为None
  3. Head(头部):

    • 类型:ClsHead
    • 损失函数:
      • 类型:CrossEntropyLoss
      • 损失权重:1.0
  4. 数据处理:

    • 图像归一化参数:
      • 均值:[123.675, 116.28, 103.53]
      • 标准差:[58.395, 57.12, 57.375]
      • 是否转为RGB格式:True
  5. 训练参数:

    • 批量大小:8
    • 训练数据加载器的工作线程数:4
    • 是否使用预训练权重:False
    • 是否冻结特定层:False
    • 要冻结的层:('backbone',)
    • 训练周期数:100
  6. 测试参数:

    • 检查点路径:''
    • 评估指标:准确率、精确率、召回率、F1分数、混淆矩阵
    • 评估指标选项:
      • topk:(1, 2)
      • thrs:None
      • 平均模式:'none'
  7. 优化器参数:

    • 类型:SGD
    • 学习率:0.001
    • 动量:0.9
    • 权重衰减:1e-4
  8. 学习率调整配置:

    • 类型:StepLrUpdater
    • 调整步数:每15个周期调整一次学习率

图1:

让batch-size缩小一倍:

图2:

图二数据损失对比图一更加平滑,且下降梯度更大,速度更快,下降过程中方向调整更为敏感。

但在拟合过程中ACC全局波动更大

相关推荐
是毛毛吧几秒前
AI开发工具----碾压 Bolt.new?Lovable:全栈开发的下一个“卷王”级神器深度评测
人工智能·开源·github
weixin_437988126 分钟前
范式智能+壁仞科技|完成百余款模型适配 性能优势显著
人工智能·科技
技术狂人16811 分钟前
(三)模型微调技术 20 题!LoRA/Q-LoRA/PPO/DPO 落地细节,面试说清微调全流程(实战篇)
人工智能·深度学习·算法·nlp
chenshi178123 分钟前
匠厂和普通SEO工具有什么区别?深度评测GEO自动化效率
大数据·人工智能
龙腾AI白云23 分钟前
深度学习—卷积神经网络(4)
人工智能·深度学习
ggabb28 分钟前
黄仁勋“五层蛋糕”揭秘中美AI暗战:从能源到物理AI的全维博弈
人工智能·能源
●VON28 分钟前
智慧校园2.0:人工智能如何重塑教与学的未来
人工智能·学习·von
我命由我1234535 分钟前
LangChain 学习 - Langchain Model IO(环境安装、大模型应用开发、模型分类、模型消息)
人工智能·python·ai·语言模型·pycharm·langchain·python3.11
乾元37 分钟前
边缘计算网络的自动流量分配与用户感知 QoE 优化——从“链路最优”到“体验最优”的网络控制闭环
运维·网络·人工智能·网络协议·重构·边缘计算
小北方城市网38 分钟前
GEO 新生态:跨界融合 + 场景渗透,重构 AI 时代本地商业增长版图
大数据·网络·人工智能·python·状态模式