PyTorch踩坑记录1

1 model.eval()无法关闭dropout

因为model.eval()控制self.training参数,只有用nn.Dropout(0.5)声明才能在调用model.eval()后关闭,用F.dropout(x, p=0.5)是没办法自动关闭的,需要手动把self.training的参数传入到F.dropout()里才行。

网上查到是因为model.eval()会影响继承nn.module类的self.方法的训练和测试,但是F.dropout更像是一个函数没继承nn,module。

另外,回归模型在后面几层应该避免使用dropout,最多在浅层使用。

2 BCEloss归一化

在tf2中BCEloss没有归一化,但是在torch中的损失函数是归一化了的。

相关推荐
bupt_0113 小时前
claudecode深入理解及源码解析(一):从 main.tsx 入口到对话闭环
人工智能·语言模型
2601_9578822413 小时前
企业矩阵系统建设实践:优化内容资产与数字获客流程
大数据·人工智能·矩阵系统·企业数字化运营
GIS数据转换器13 小时前
智慧能源管理平台
java·大数据·运维·人工智能·无人机
小橙讲编程13 小时前
MoneyPrinterTurbo 深度解析与部署实战:AI 一键短视频生成,从源码到上线全攻略
人工智能·音视频
skywalk816313 小时前
DeepSeek 原生的终端 AI 编程代理 Reasonix
人工智能
Slow菜鸟13 小时前
AI 代码知识图谱 教程(二)| Graphify(代码+文档)
人工智能·知识图谱
代码里的AI星13 小时前
AI心智得分实战指南:如何用搜极星掌握品牌AI话语权
人工智能
一次旅行13 小时前
AI技术热点简报 | 2026.05.29
人工智能
wan55cn@126.com13 小时前
调试协作之歌
人工智能·笔记·微信