PyTorch踩坑记录1

1 model.eval()无法关闭dropout

因为model.eval()控制self.training参数,只有用nn.Dropout(0.5)声明才能在调用model.eval()后关闭,用F.dropout(x, p=0.5)是没办法自动关闭的,需要手动把self.training的参数传入到F.dropout()里才行。

网上查到是因为model.eval()会影响继承nn.module类的self.方法的训练和测试,但是F.dropout更像是一个函数没继承nn,module。

另外,回归模型在后面几层应该避免使用dropout,最多在浅层使用。

2 BCEloss归一化

在tf2中BCEloss没有归一化,但是在torch中的损失函数是归一化了的。

相关推荐
李可以量化15 小时前
成交量的终极量化策略:价量共振指标完整实现(下篇)
前端·数据库·人工智能
ASKED_201915 小时前
2026 大模型 API 定价全景图:DeepSeek、豆包、Qwen、GLM、MiniMax、Kimi、Claude、Gemini、GPT 谁最便宜?
人工智能·gpt
波动几何15 小时前
业务运营领域business-operations-assessment
人工智能
giszz15 小时前
【WorkBuddy专栏14】专家不是「换皮」——角色切换、训练机制与自我进化深度拆解
人工智能
zzu123zsw15 小时前
skillup Basic 桌面客户端
人工智能
关山月15 小时前
实战指南:利用 Git Worktrees 实现同仓库多 AI Agent 并行开发
人工智能
君为先-bey15 小时前
JointDiT:使用扩散变换器增强RGB-深度联合建模
人工智能·深度学习·计算机视觉·扩散模型·图像生成
keruilai076915 小时前
多尘潮湿工业复杂工况 防腐耐用降温设备适配现场环境
人工智能
林爷万福15 小时前
GitHub 开源光谱数据处理项目推荐
python·光纤光谱仪