PyTorch踩坑记录1

1 model.eval()无法关闭dropout

因为model.eval()控制self.training参数,只有用nn.Dropout(0.5)声明才能在调用model.eval()后关闭,用F.dropout(x, p=0.5)是没办法自动关闭的,需要手动把self.training的参数传入到F.dropout()里才行。

网上查到是因为model.eval()会影响继承nn.module类的self.方法的训练和测试,但是F.dropout更像是一个函数没继承nn,module。

另外,回归模型在后面几层应该避免使用dropout,最多在浅层使用。

2 BCEloss归一化

在tf2中BCEloss没有归一化,但是在torch中的损失函数是归一化了的。

相关推荐
星越华夏几秒前
Qt5状态栏刷新显示内容
python·qt
FIT2CLOUD飞致云1 分钟前
学习笔记丨基于MaxKB实现JumpServer堡垒机自动化巡检
人工智能·ai·开源·智能体·maxkb
吕源林3 分钟前
PHP源码能否在Chromebook上运行_ChromeOS硬件限制说明【解答】
jvm·数据库·python
pele4 分钟前
c++如何读取YAML格式配置文件_yaml-cpp库快速入门【详解】
jvm·数据库·python
captain_AIouo5 分钟前
OZON运营全场景导入,Captain AI系统功能适配效果
大数据·人工智能·经验分享·aigc
Francek Chen6 分钟前
【华为Pura90系列】新品发布:Pura 90系列影像领衔,Pura X Max开启大阔折叠新赛道
人工智能·华为·harmonyos·pura 90
Python大数据分析@6 分钟前
低代码爬虫工具结合Python Selenium,自动采集商品数据
爬虫·python·低代码
johnny2336 分钟前
Python生态GUI框架:Gooey、Pywinauto、PyQuery、JustPy、Maliang、
python
CAE3206 分钟前
基于Matlab Simulink的三轴运动平台刚柔耦合仿真
人工智能·matlab·模态·刚柔耦合·三轴运动
ACP广源盛139246256736 分钟前
长距传输全能芯 @ACP#GSV5800 Type‑C/DP1.4/HDMI2.0 高速延长芯片
c语言·开发语言·网络·人工智能·嵌入式硬件·计算机外设·电脑