PyTorch踩坑记录1

1 model.eval()无法关闭dropout

因为model.eval()控制self.training参数,只有用nn.Dropout(0.5)声明才能在调用model.eval()后关闭,用F.dropout(x, p=0.5)是没办法自动关闭的,需要手动把self.training的参数传入到F.dropout()里才行。

网上查到是因为model.eval()会影响继承nn.module类的self.方法的训练和测试,但是F.dropout更像是一个函数没继承nn,module。

另外,回归模型在后面几层应该避免使用dropout,最多在浅层使用。

2 BCEloss归一化

在tf2中BCEloss没有归一化,但是在torch中的损失函数是归一化了的。

相关推荐
MYH5163 分钟前
汽车停车匹配充电桩随机森林
python·随机森林·汽车
张较瘦_10 分钟前
[论文阅读] 人工智能 | 用大语言模型抓虫:如何让网络协议实现与RFC规范对齐
论文阅读·人工智能·语言模型
鼓掌MVP11 分钟前
Python多线程编程:从GIL锁到实战优化
python
qb_jiajia16 分钟前
微软认证考试科目众多?该如何选择?
人工智能·microsoft·微软·云计算
天天爱吃肉821817 分钟前
【十年技术演进深度解构:车载充电机(OBC)将成为新能源汽车的“能源大脑”】
python·嵌入式硬件·算法·汽车·能源
这里有鱼汤18 分钟前
有人说10日低点买入法,赢率高达95%?我不信,于是亲自回测了下…
后端·python
pen-ai29 分钟前
【统计方法】蒙特卡洛
人工智能·机器学习·概率论
阿幸软件杂货间30 分钟前
video-audio-extractor【源码版】
python
说私域35 分钟前
基于开源AI智能名片链动2+1模式S2B2C商城小程序的生态农庄留存运营策略研究
人工智能·小程序·开源·零售
摘取一颗天上星️43 分钟前
大模型微调技术全景图:从全量更新到参数高效适配
人工智能·深度学习·机器学习