PyTorch踩坑记录1

1 model.eval()无法关闭dropout

因为model.eval()控制self.training参数,只有用nn.Dropout(0.5)声明才能在调用model.eval()后关闭,用F.dropout(x, p=0.5)是没办法自动关闭的,需要手动把self.training的参数传入到F.dropout()里才行。

网上查到是因为model.eval()会影响继承nn.module类的self.方法的训练和测试,但是F.dropout更像是一个函数没继承nn,module。

另外,回归模型在后面几层应该避免使用dropout,最多在浅层使用。

2 BCEloss归一化

在tf2中BCEloss没有归一化,但是在torch中的损失函数是归一化了的。

相关推荐
企业智能研究11 分钟前
2026,企业如何应用AI Agent赋能业务?
人工智能·云计算·agent
大黄说说14 分钟前
Python 实战指南:一键批量旋转 PDF 页面方向
开发语言·python·pdf
宁远x20 分钟前
【VeRL】Qwen3-30B-A3B-DAPO NPU实践指导
人工智能·深度学习·强化学习
heimeiyingwang36 分钟前
向量数据库VS关系数据库VS非关系数据库
运维·人工智能·重构·架构·机器人
shangyingying_137 分钟前
图像质量评价(IQA)
人工智能·python·神经网络
OPEN-Source38 分钟前
大模型 Agent 实战:多 Agent 太贵太慢?一套系统性的性能与成本优化方案
人工智能·python·agent·rag·deepseek
了不起的云计算V39 分钟前
2026年信创替代关键期:如何选真正“安全好用”的电脑?
人工智能·安全·电脑
一阵寒风39 分钟前
ComfyUI本地部署指南
开发语言·人工智能·python
高洁011 小时前
大模型架构演进:从Transformer到MoE
python·深度学习·机器学习·数据挖掘·知识图谱
谁不学习揍谁!1 小时前
基于python机器学习算法的农作物产量可视化分析预测系统(完整系统源码+数据库+详细文档+论文+详细部署教程+答辩PPT)获取方式
python·算法·机器学习