PyTorch踩坑记录1

1 model.eval()无法关闭dropout

因为model.eval()控制self.training参数,只有用nn.Dropout(0.5)声明才能在调用model.eval()后关闭,用F.dropout(x, p=0.5)是没办法自动关闭的,需要手动把self.training的参数传入到F.dropout()里才行。

网上查到是因为model.eval()会影响继承nn.module类的self.方法的训练和测试,但是F.dropout更像是一个函数没继承nn,module。

另外,回归模型在后面几层应该避免使用dropout,最多在浅层使用。

2 BCEloss归一化

在tf2中BCEloss没有归一化,但是在torch中的损失函数是归一化了的。

相关推荐
探物 AI几秒前
【感知实战·数据增强篇】深度解析目标检测中的图片数据增强算法,多图演示效果
人工智能·算法·目标检测
2401_88772450几秒前
Redis怎样统计独立访客UV_基于Set的SADD指令天然去重特性
jvm·数据库·python
QYR-分析1 分钟前
全地形轮足机器人行业发展分析:分类、格局与市场机遇
大数据·人工智能·机器人
Codigger官方1 分钟前
生态破局:从孤岛工具到协同奇点
开发语言·人工智能·程序人生
qq_283720054 分钟前
Python3 模块精讲:pyecharts —— 交互式数据可视化全解与实战
python·信息可视化·数据分析·echarts·数据可视化·pyecharts
竹之却4 分钟前
【Agent-阿程】AI先锋杯·14天征文挑战第14期-第14天-OpenClaw 全配置目录结构与核心配置文件详解
人工智能·openclaw
m0_716430076 分钟前
SQL如何处理时间序列缺失值_利用窗口函数进行前后值填充
jvm·数据库·python
Wenzar_6 分钟前
**发散创新:基于算子融合的深度学习推理优化实战**在现代AI推理场景中,模型性能瓶颈往往不是由单一算子决定的,而是多个连续算子之间数
java·人工智能·深度学习
小陈99cyh6 分钟前
安装NVIDIA Container Toolkit,让gpu容器环境跑通
运维·pytorch·docker·nvidia
dLYG DUMS6 分钟前
Redis——使用 python 操作 redis 之从 hmse 迁移到 hset
数据库·redis·python