Awesome-Backbones-main——alexnet模型分析

AlexNet作为骨干网络相对较老,可能在复杂数据集上的表现不如一些最新的深度网络结构,如ResNet、EfficientNet等,学习率调整策略中采用了阶梯式学习率更新器,可能并不总是适合所有数据集和模型,需要根据具体情况调整学习率策略。

模型参数:

  1. Backbone(骨干网络):

    • 类型:AlexNet
    • 输出类别数:4
  2. Neck:

    • 在配置中未指定,为None
  3. Head(头部):

    • 类型:ClsHead
    • 损失函数:
      • 类型:CrossEntropyLoss
      • 损失权重:1.0
  4. 数据处理:

    • 图像归一化参数:
      • 均值:[123.675, 116.28, 103.53]
      • 标准差:[58.395, 57.12, 57.375]
      • 是否转为RGB格式:True
  5. 训练参数:

    • 批量大小:8
    • 训练数据加载器的工作线程数:4
    • 是否使用预训练权重:False
    • 是否冻结特定层:False
    • 要冻结的层:('backbone',)
    • 训练周期数:100
  6. 测试参数:

    • 检查点路径:''
    • 评估指标:准确率、精确率、召回率、F1分数、混淆矩阵
    • 评估指标选项:
      • topk:(1, 2)
      • thrs:None
      • 平均模式:'none'
  7. 优化器参数:

    • 类型:SGD
    • 学习率:0.001
    • 动量:0.9
    • 权重衰减:1e-4
  8. 学习率调整配置:

    • 类型:StepLrUpdater
    • 调整步数:每15个周期调整一次学习率

图1:

让batch-size缩小一倍:

图2:

图二数据损失对比图一更加平滑,且下降梯度更大,速度更快,下降过程中方向调整更为敏感。

但在拟合过程中ACC全局波动更大

相关推荐
上海云盾第一敬业销售6 分钟前
DeepSeek等大模型API成攻击新靶点:WAF如何防护生成式AI服务接口
人工智能
OpenCSG8 分钟前
开源视频生成新突破:Sulphur 2 让“无审查“AI视频走向大众
人工智能
一次旅行10 分钟前
今日 AI 新闻简报2026.5.8
人工智能
郑寿昌17 分钟前
Agent记忆与知识图谱融合实现跨任务迁移
人工智能·知识图谱
ComputerInBook18 分钟前
数字图像处理(4版)——第 11 章——特征提取(上)(Rafael C.Gonzalez&Richard E. Woods)
人工智能·深度学习·计算机视觉·特征提取
这张生成的图像能检测吗23 分钟前
(论文速读)HAFNet:用于红外小目标检测的分层注意力融合网络
人工智能·神经网络·目标检测·计算机视觉·图像分割
谙弆悕博士30 分钟前
GPT-5.5 Instant 免费开放背后的技术跃迁与战略阳谋
人工智能·python·gpt·chatgpt·学习方法·业界资讯
Purple Coder33 分钟前
《电池储能系统全书:从电芯到电网的公用事业级储能指南》-3
人工智能
AI精钢34 分钟前
把 Markdown 笔记变成可问答的知识图谱:本地 Graph RAG 工具 Kwipu 实测
人工智能·笔记·python·aigc·知识图谱
kobesdu39 分钟前
【ROS2实战笔记-15】ros2bag 的深度应用:从数据回放到系统级离线分析
人工智能·笔记·移动机器人·ros2