Day44 训练和测试的规范写法

1. 彩色 / 灰度图的训练测试规范:"封装在函数里"

简单说就是把 "训练模型" 和 "测试模型" 的代码,分别写成两个独立的函数(比如叫train()test())。

  • 好处:代码更整洁,想训练就调用train(),想测试就调用test(),后续复用也方便。

2. 展平操作:"除 batchsize 外全部展平"

比如你有一张彩色图,形状是[batchsize, 高, 宽, 通道数](比如[32, 28, 28, 3],代表 32 张 28×28 的 3 通道彩色图)。"展平" 就是把高、宽、通道数这几个维度合并成一个维度,变成[32, 28×28×3](也就是[32, 2352])。

  • 目的:把图片的 "二维像素 + 通道" 变成 "一维向量",方便后续模型计算。

3. dropout 操作:"训练丢、测试关"

dropout 是防止模型 "学太死" 的技巧:

  • 训练阶段:随机让一部分神经元 "罢工"(不参与计算),避免模型过度依赖某些神经元。
  • 测试阶段 :要切换到eval模式,把 dropout 关掉(所有神经元都工作),这样才能得到稳定的测试结果。

@浙大疏锦行

相关推荐
说了很好1 小时前
PyTorch从零搭建DDPM:时间嵌入+UNet网络+扩散调度完整复现
人工智能
Bigfish_coding1 小时前
前端转agent-【python】-06 长期记忆(向量数据库 + 嵌入)
人工智能
小林ixn1 小时前
别再手写Prompt了!用AI Loop实现自动化自我迭代,效率提升10倍
人工智能·自动化运维
说了很好1 小时前
逐行注释DDPM源码:正向加噪、逆向去噪、MSE损失全流程复现
人工智能
Dilee1 小时前
Spring AI 1.1.7 接入 MCP:Filesystem Server 最小 Demo
人工智能·后端
Token炼金师1 小时前
大模型推理超参数原理详解
人工智能
Token炼金师1 小时前
大模型训练超参数:从Loss曲面到收敛策略的底层逻辑
人工智能
后端小肥肠1 小时前
Skill 囤了一堆却用不起来?我用 Codex 写了个整理神器
人工智能·agent
魏祖潇1 小时前
从"会聊天"到"能干活":用 OpenCode 给自己找个 AI 搭子
人工智能
子兮曰1 小时前
AI Coding Method Map:一张图看懂 AI 编程的完整链路
前端·人工智能·后端