PyTorch踩坑记录1

1 model.eval()无法关闭dropout

因为model.eval()控制self.training参数,只有用nn.Dropout(0.5)声明才能在调用model.eval()后关闭,用F.dropout(x, p=0.5)是没办法自动关闭的,需要手动把self.training的参数传入到F.dropout()里才行。

网上查到是因为model.eval()会影响继承nn.module类的self.方法的训练和测试,但是F.dropout更像是一个函数没继承nn,module。

另外,回归模型在后面几层应该避免使用dropout,最多在浅层使用。

2 BCEloss归一化

在tf2中BCEloss没有归一化,但是在torch中的损失函数是归一化了的。

相关推荐
一个数据大开发10 小时前
本体论与大模型的融合实践:知识图谱的下一个十年
人工智能·知识图谱
电子云与长程纠缠10 小时前
UE5制作六边形包裹球体效果
开发语言·python·ue5
赋范大模型技术社区10 小时前
对标 Codex、Claude Code,DeepSeek要做一个什么东西?
人工智能
IT_陈寒10 小时前
Vite动态导入把我坑惨了,原来要这样用才对
前端·人工智能·后端
DFT计算杂谈10 小时前
KPROJ编译教程
java·前端·python·算法·conda
hh.h.10 小时前
昇腾CANN community 仓:社区治理与贡献指南
人工智能·ascend·cann·community
ZGi.ai10 小时前
采购部门用AI审供应商资质:从3天压缩到3小时的方案
大数据·人工智能·rag·供应商管理·企业ai·文档审核·采购ai
Agent产品评测局10 小时前
新能源制造供应链AI方案主流产品对比测评 —— 2026年企业级自动化选型深度指南
人工智能·ai·chatgpt·自动化·制造
Miss roro11 小时前
法律科技的发展脉络:从数字化管理到AI辅助办案的演进路径
大数据·人工智能·科技·法律科技·律所管理系统·案件管理系统
Gradpaper411 小时前
论文之后,表达之前:PPT 是关键一步
人工智能