PyTorch踩坑记录1

1 model.eval()无法关闭dropout

因为model.eval()控制self.training参数,只有用nn.Dropout(0.5)声明才能在调用model.eval()后关闭,用F.dropout(x, p=0.5)是没办法自动关闭的,需要手动把self.training的参数传入到F.dropout()里才行。

网上查到是因为model.eval()会影响继承nn.module类的self.方法的训练和测试,但是F.dropout更像是一个函数没继承nn,module。

另外,回归模型在后面几层应该避免使用dropout,最多在浅层使用。

2 BCEloss归一化

在tf2中BCEloss没有归一化,但是在torch中的损失函数是归一化了的。

相关推荐
清水白石008几秒前
从手写初始化到 pytest fixture:让 Python 测试既干净、可复用,又能驾驭异步并发
开发语言·python·pytest
Mr.Cheng.几秒前
Automatically Interpreting Millions of Features in Large Language Models
人工智能·语言模型·自然语言处理
多年小白3 分钟前
【行情复盘】2026年5月8日(周五)
大数据·人工智能·科技·gpt·深度学习·ai
Mr数据杨5 分钟前
【CanMV K210】AI 视觉 YOLO 多类别目标检测实验
人工智能·硬件开发·canmv k210
Aipollo5 分钟前
行业Agent记忆:从功能分类到实现路径
人工智能·分类·数据挖掘·milvus
流放深圳5 分钟前
抓住 AI 人工智能的风口之第 1 章 —— 8万字熟练掌握 SpringAI 编程核心概念
人工智能·大模型·ollama·springai
人工智能培训5 分钟前
集中式与分布式智能:单个复杂智能体 vs. 多个简单智能体协同
大数据·人工智能·机器学习·计算机视觉·知识图谱
贫民窟的勇敢爷们6 分钟前
Scikit-learn机器学习项目:从入门到实战的价值与实践
python·机器学习·scikit-learn
AI科技星7 分钟前
圓 全域数学·72分册·哈希原本卷(七册分卷 · 72分册 · 习题与猜想版)
人工智能·算法·数学建模·数据挖掘·哈希算法·量子计算
sali-tec7 分钟前
C# 基于OpenCv的视觉工作流-章70-轮廓点距
图像处理·人工智能·opencv·算法·计算机视觉