PyTorch踩坑记录1

1 model.eval()无法关闭dropout

因为model.eval()控制self.training参数,只有用nn.Dropout(0.5)声明才能在调用model.eval()后关闭,用F.dropout(x, p=0.5)是没办法自动关闭的,需要手动把self.training的参数传入到F.dropout()里才行。

网上查到是因为model.eval()会影响继承nn.module类的self.方法的训练和测试,但是F.dropout更像是一个函数没继承nn,module。

另外,回归模型在后面几层应该避免使用dropout,最多在浅层使用。

2 BCEloss归一化

在tf2中BCEloss没有归一化,但是在torch中的损失函数是归一化了的。

相关推荐
henrylin99992 小时前
开源量化软件功能介绍
python·开源
C+-C资深大佬2 小时前
Python 新手学习指南
开发语言·python
IT阿瑞2 小时前
制造业 AI Agent 实施服务商横评:2026 年企业级自动化选型全景分析
大数据·人工智能·自动化
kishu_iOS&AI2 小时前
LLM —— 基础知识(Bert&GPT&T5)浅析
人工智能·gpt·bert
人工智能培训2 小时前
从GPT到开源大模型
人工智能·gpt·深度学习·机器学习·容器·知识图谱
数据仓库搬砖人2 小时前
从零搭建你的第一个 AI Agent:LangGraph 完全上手指南
人工智能
宋哥转AI2 小时前
Java后端转AI Agent:技术栈全景图与从ReAct到多Agent协作实战
java·人工智能·agent
樱花的浪漫2 小时前
Typescript、Zod基础
前端·javascript·人工智能·语言模型·自然语言处理·typescript
媒介发稿小能手2 小时前
合规优化与API接口协同:2026年靠谱GEO媒介资源平台推荐清单
大数据·人工智能
嫂子的姐夫2 小时前
050-wx小程序合肥住房
爬虫·python·小程序·逆向