PyTorch踩坑记录1

1 model.eval()无法关闭dropout

因为model.eval()控制self.training参数,只有用nn.Dropout(0.5)声明才能在调用model.eval()后关闭,用F.dropout(x, p=0.5)是没办法自动关闭的,需要手动把self.training的参数传入到F.dropout()里才行。

网上查到是因为model.eval()会影响继承nn.module类的self.方法的训练和测试,但是F.dropout更像是一个函数没继承nn,module。

另外,回归模型在后面几层应该避免使用dropout,最多在浅层使用。

2 BCEloss归一化

在tf2中BCEloss没有归一化,但是在torch中的损失函数是归一化了的。

相关推荐
向量引擎2 小时前
多模型 API 网关接入实践:统一 Base URL、API Key 管理与故障排查
人工智能·gpt·ai编程·ai写作·key
KKKlucifer2 小时前
AI赋能安全运营,构建闭环数据风险防御体系
人工智能·安全
曾阿伦2 小时前
Python 搭建简易HTTP服务
开发语言·python·http
A_Sinon2 小时前
卷积神经网络
人工智能·神经网络·cnn
MIUMIUKK2 小时前
从语法层面,看懂 Python 的特殊处
java·开发语言·python
着迷不白2 小时前
第一部分:认识python
开发语言·python
继续商行2 小时前
跨语言 Benchmark 实战:C++、Rust、Go、Java 在 AI 向量计算场景下的性能硬核横评
人工智能
A hao2 小时前
P2与P2.5 LED显示屏的5大区别
图像处理·人工智能·广告
EAIReport3 小时前
AI本体论核心原理与WebProtégé实战:打造可推理的结构化知识体系
人工智能
hujinyuan201603 小时前
2026年3月 中国电子学会青少年软件编程(Python)三级考试试卷 真题及答案
java·python·算法