PyTorch踩坑记录1

1 model.eval()无法关闭dropout

因为model.eval()控制self.training参数,只有用nn.Dropout(0.5)声明才能在调用model.eval()后关闭,用F.dropout(x, p=0.5)是没办法自动关闭的,需要手动把self.training的参数传入到F.dropout()里才行。

网上查到是因为model.eval()会影响继承nn.module类的self.方法的训练和测试,但是F.dropout更像是一个函数没继承nn,module。

另外,回归模型在后面几层应该避免使用dropout,最多在浅层使用。

2 BCEloss归一化

在tf2中BCEloss没有归一化,但是在torch中的损失函数是归一化了的。

相关推荐
luoluoal4 分钟前
基于python的某在线中药店销售数据统计与分析系统(源码+文档)
python·mysql·django·毕业设计·源码
桂花饼4 分钟前
【重磅更新】小镜AI开放平台:Gemini 3 Pro + Sora高清长视频 + ClaudeCode特惠上线
人工智能·aigc·api 调用·gemini 3 pro·gpt-5.2·ai绘画4k
Amelia1111114 分钟前
day45
python
码农丁丁5 分钟前
从确定性到概率性:AI时代的技术决策新范式
人工智能·技术管理
Hubianji_0916 分钟前
IEEE 智能电网技术与能源工程国际学术会议
人工智能·能源·国际会议
落798.17 分钟前
打造智能健康助手:用 ModelEngine 实现实时医学问答
人工智能·modelengine
Mr数据杨20 分钟前
我把经验写成工作流,将输出做成可复用的系统
大数据·网络·人工智能
Byron Loong20 分钟前
【Python】Pytorch是个什么包
开发语言·pytorch·python
亚里随笔21 分钟前
STAgent:专为时空推理设计的智能代理模型
人工智能·深度学习·机器学习·llm·rl·agentic
珠海西格电力22 分钟前
零碳园区如何优化能源结构?
运维·人工智能·物联网·架构·能源