简单CNN——作业(补充)

调度器种类

总共训练了15个epoch,结构为三层卷积层 + 两层全连接层。

ReduceLROnPlateau

复制代码
scheduler = optim.lr_scheduler.ReduceLROnPlateau(
    optimizer=optimizer,        # 指定要控制的优化器(这里是Adam)
    mode='min',       # 监测的指标是"最小化"(如损失函数)
    patience=3,       # 如果连续3个epoch指标没有改善,才降低LR
    factor=0.5        # 降低LR的比例(新LR = 旧LR × 0.5)
)

最终测试集准确率为78.50 %,累计平均损失为0.7247

StepLR

复制代码
scheduler = optim.lr_scheduler.StepLR(optimizer, step_size=5, gamma=0.1)  

最终测试集准确率为78.63 %,累计平均损失为0.7534

MultiStepLR

复制代码
scheduler = optim.lr_scheduler.MultiStepLR(optimizer, milestones=[10, 20, 30], gamma=0.5)  

最终测试集准确率为79.17 %,累计平均损失为0.7035

CosineAnnealingLR

复制代码
scheduler = optim.lr_scheduler.CosineAnnealingLR(optimizer, T_max=10, eta_min=0.0001)  

最终测试集准确率为78.05 %,累计平均损失为0.6986,整个训练内波动有点大。

在当前情况下(存在误差,每一个调度器只训练了一次),综合准确率和累计平均损失来看,使用MultiStepLR作为调度器的结果最好

|-------------------|--------|--------|--------|
| 调度器 | 测试集准确率 | 训练集准确率 | 累计平均损失 |
| ReduceLROnPlateau | 78.50% | 74.58% | 0.7247 |
| StepLR | 78.63% | 73.80% | 0.7534 |
| MultiStepLR | 79.17% | 75.36% | 0.7035 |
| CosineAnnealingLR | 78.05% | 75.60% | 0.6986 |

CNN结构

增加一层全连接层,测试集准确率为79.06%,累计平均损失为0.7293

复制代码
def forward(self, x):
        # 第一个卷积层后接ReLU激活函数和最大池化操作,经过池化后图像尺寸变为原来的一半,这里输出尺寸变为16x16
        x = self.pool(F.relu(self.conv1(x)))  # F.relu()不支持hook,无法监控中间结果
        # 第二个卷积层后接ReLU激活函数和最大池化操作,输出尺寸变为8x8
        x = self.pool(F.relu(self.conv2(x)))  
        # 第三个卷积层后接ReLU激活函数和最大池化操作,输出尺寸变为4x4
        x = self.pool(F.relu(self.conv3(x)))  
        # 将特征图展平为一维向量,以便输入到全连接层
        x = x.view(-1, 128 * 4 * 4)
        # 第一个全连接层后接ReLU激活函数
        x = F.relu(self.fc1(x))
        # 第二个全连接层后接ReLU激活函数
        x = F.relu(self.fc2(x))
        x = self.dropout(x) # p=0.5
        # 第三个全连接层输出分类结果
        x = self.fc3(x)
        return x
相关推荐
mys55186 分钟前
杨建允:AI搜索时代文旅品牌的GEO优化营销策略
人工智能·ai搜索优化·geo优化·文旅geo·文旅品牌geo
hsg7710 分钟前
简述:torchgeo
人工智能·深度学习
ForDreamMusk13 分钟前
PyTorch编程基础
人工智能·pytorch
喵喵侠w13 分钟前
Rokid 智能眼镜开发实战:制作一款花草树木识别智能体
人工智能
小程故事多_8013 分钟前
从推理到智能体,大模型强化学习中信用分配机制的演进与突破
人工智能·prompt·aigc·ai编程
人工智能研究所17 分钟前
Claude + HyperFrames:用 HTML 方式制作视频,AI 时代一切皆可 HTML?
人工智能·html·音视频·ai 视频·hyperframes·claude-
是娇娇公主~25 分钟前
AI Agent详解
人工智能·ai agent
CV-杨帆28 分钟前
RAG 与记忆机制本质辨析及研究路径评估
人工智能
AI医影跨模态组学34 分钟前
如何通过MRI识别的系膜筋膜侵犯类型关联局部晚期直肠癌的免疫微环境及肿瘤增殖活性,并进一步解释其与预后不良的机制联系
人工智能·论文·医学·医学影像
人机与认知实验室37 分钟前
如何用四维矩阵建模计算性的态势感知与算计性的势态知感?
人工智能·线性代数·矩阵