PyTorch踩坑记录1

1 model.eval()无法关闭dropout

因为model.eval()控制self.training参数,只有用nn.Dropout(0.5)声明才能在调用model.eval()后关闭,用F.dropout(x, p=0.5)是没办法自动关闭的,需要手动把self.training的参数传入到F.dropout()里才行。

网上查到是因为model.eval()会影响继承nn.module类的self.方法的训练和测试,但是F.dropout更像是一个函数没继承nn,module。

另外,回归模型在后面几层应该避免使用dropout,最多在浅层使用。

2 BCEloss归一化

在tf2中BCEloss没有归一化,但是在torch中的损失函数是归一化了的。

相关推荐
彬鸿科技8 分钟前
bhSDR Studio/Matlab入门指南(九):FMCW雷达测距实验界面全解析
人工智能·matlab·软件定义无线电
补三补四9 分钟前
Prompt工程实践指南:从基础概念到高级应用
人工智能·chatgpt·prompt
weixin_4080996718 分钟前
图片去水印 API 接口实战:网站如何实现自动去水印(Python / PHP / C#)
图像处理·人工智能·python·c#·php·api·图片去水印
yyk的萌18 分钟前
AI 应用开发工程师基础学习计划
开发语言·python·学习·ai·lua
ZGIS智博创享30 分钟前
地质调查数据采集系统专栏① | ZGIS以科技赋能,促进地质调查迈入数智新时代
人工智能·科技·地质调查数据采集系统
SP八岐大兔32 分钟前
AI对话&OpenClaw全域终极指令大全
网络·人工智能·openclaw
zxhl092733 分钟前
大模型微调技术 LoRA、QLoRA、QA-LoRA 原理
人工智能·深度学习·机器学习
龙文浩_36 分钟前
AI深度学习中的PyTorch与张量案例
人工智能·pytorch·深度学习
木斯佳1 小时前
前端八股文面经大全:影刀AI前端一面(2026-04-01)·面经深度解析
前端·人工智能·沙箱·tool·ai面经
Hello.Reader1 小时前
从零构建大语言模型——理解大语言模型 LLM 是什么、应用与训练范式(一)
人工智能·语言模型·自然语言处理