day45

  1. 彩色和灰度图片测试和训练的规范写法:

封装在函数中

由于彩色图(3 通道)和灰度图(1 通道)的输入格式不同,但训练 / 测试的核心逻辑(前向传播、损失计算、指标评估)是通用的,因此需将训练、测试逻辑封装为独立函数,实现 "一次编写、多场景复用"。

  1. 展平操作:除第一个维度 batchsize 外全部展平

展平操作用于将多维特征转换为一维向量,以便输入全连接层(全连接层仅接受一维输入)。

核心规则:保留第 0 维(batchsize),将后续所有维度展平为一维。

常用实现方式

torch.flatten(input, start_dim=1):从start_dim开始展平;

torch.view(-1, num_features):通过形状变换展平(需手动计算展平后的特征数)。

  1. dropout 操作:训练阶段随机丢弃神经元,测试阶段 eval 模式关闭 dropout

Dropout是防止过拟合的常用方法,其训练 / 测试阶段的行为不同:

训练阶段:随机丢弃一部分神经元,迫使模型学习更鲁棒的特征;

测试阶段:不丢弃神经元(否则会降低模型性能),但需将所有神经元的输出乘以(1-p),保证输出分布与训练阶段一致。

如何自动切换 dropout 状态?

PyTorch 中通过model.train()和model.eval()自动控制:

model.train():切换到训练模式,启用 dropout;

model.eval():切换到测试模式,关闭 dropout(同时固定 BatchNorm 的均值 / 方差)。

作业:

@浙大疏锦行

相关推荐
AI探索者3 小时前
LangGraph StateGraph 实战:状态机聊天机器人构建指南
python
AI探索者3 小时前
LangGraph 入门:构建带记忆功能的天气查询 Agent
python
FishCoderh5 小时前
Python自动化办公实战:批量重命名文件,告别手动操作
python
躺平大鹅5 小时前
Python函数入门详解(定义+调用+参数)
python
曲幽6 小时前
我用FastAPI接ollama大模型,差点被asyncio整崩溃(附对话窗口实战)
python·fastapi·web·async·httpx·asyncio·ollama
两万五千个小时9 小时前
落地实现 Anthropic Multi-Agent Research System
人工智能·python·架构
哈里谢顿12 小时前
Python 高并发服务限流终极方案:从原理到生产落地(2026 实战指南)
python
用户8356290780511 天前
无需 Office:Python 批量转换 PPT 为图片
后端·python
markfeng81 天前
Python+Django+H5+MySQL项目搭建
python·django
GinoWi1 天前
Chapter 2 - Python中的变量和简单的数据类型
python