PyTorch踩坑记录1

1 model.eval()无法关闭dropout

因为model.eval()控制self.training参数,只有用nn.Dropout(0.5)声明才能在调用model.eval()后关闭,用F.dropout(x, p=0.5)是没办法自动关闭的,需要手动把self.training的参数传入到F.dropout()里才行。

网上查到是因为model.eval()会影响继承nn.module类的self.方法的训练和测试,但是F.dropout更像是一个函数没继承nn,module。

另外,回归模型在后面几层应该避免使用dropout,最多在浅层使用。

2 BCEloss归一化

在tf2中BCEloss没有归一化,但是在torch中的损失函数是归一化了的。

相关推荐
Engineer邓祥浩2 分钟前
宏观认知(3):AI战略与社会影响——吴恩达《AI for Everyone》Week3学习笔记
人工智能·笔记·学习
weixin_4684668510 分钟前
图像连通域分析新手实战指南
图像处理·人工智能·深度学习·ai·机器视觉·连通域
Hanniel11 分钟前
Python 元类(下):进阶与实战建议
开发语言·python
狒狒热知识15 分钟前
中小企业品牌破局之道178软文网以轻量化传播助力软文营销从零到一
人工智能
J2虾虾16 分钟前
Spring AI Alibaba - Models 模型
人工智能·spring·microsoft
万俟淋曦22 分钟前
【论文速递】2026年第01周(Dec-28-Jan-03)(Robotics/Embodied AI/LLM)
人工智能·ai·机器人·大模型·论文·robotics·具身智能
mONESY23 分钟前
Python 字典(dict):从原理到实战,彻底搞懂哈希表核心
python
不务正业的小主治23 分钟前
ezygene-多种算法计算免疫评分
人工智能·r语言·简析基因·ezygene·免疫分析
程序大视界25 分钟前
AI多模态大模型技术全景(2026):从“拼接“到“原生统一“,一文读懂底层架构与主流方案
人工智能·架构·多模态
qcx2328 分钟前
【系统学AI】15 RAG评测体系:RAGAS四维+TruLens+ARES全套方案
人工智能·rag·评测