PyTorch踩坑记录1

1 model.eval()无法关闭dropout

因为model.eval()控制self.training参数,只有用nn.Dropout(0.5)声明才能在调用model.eval()后关闭,用F.dropout(x, p=0.5)是没办法自动关闭的,需要手动把self.training的参数传入到F.dropout()里才行。

网上查到是因为model.eval()会影响继承nn.module类的self.方法的训练和测试,但是F.dropout更像是一个函数没继承nn,module。

另外,回归模型在后面几层应该避免使用dropout,最多在浅层使用。

2 BCEloss归一化

在tf2中BCEloss没有归一化,但是在torch中的损失函数是归一化了的。

相关推荐
GEO索引未来3 分钟前
一文说清2026年GPT 卖货两种方式
人工智能·gpt·ai·chatgpt
2501_9458374315 分钟前
OpenClaw:让 AI 从 “动口” 到 “动手” 的本地智能执行引擎
人工智能
一山秋叶23 分钟前
EDM 框架下的扩散模型们
人工智能·aigc·stablediffusion
咕噜企业分发小米25 分钟前
GPUStack × CherryStudio:为企业用户构建安全可靠的本地私有化 AI 助手(中)
人工智能
Yolo566Q25 分钟前
基于Python语言快速批量运行DSSAT模型及交叉融合、扩展应用技术应用
大数据·人工智能
KuAI_KST27 分钟前
2026 抖音私信 AI 客服实战手册:快商通 AI 与人工回复转化对比实测
大数据·人工智能·机器学习
OpenCSG33 分钟前
AI 公司 Cohere 正式发布了其首款语音模型 Cohere Transcribe
人工智能
NOCSAH37 分钟前
体验统好AI租赁管理:业务闭环与智能数据决策
大数据·人工智能·统好ai
LittroInno44 分钟前
边缘AI目标检测与跟踪——模块化技术架构对比分析
人工智能·目标检测·目标跟踪·架构·无人机