PyTorch踩坑记录1

1 model.eval()无法关闭dropout

因为model.eval()控制self.training参数,只有用nn.Dropout(0.5)声明才能在调用model.eval()后关闭,用F.dropout(x, p=0.5)是没办法自动关闭的,需要手动把self.training的参数传入到F.dropout()里才行。

网上查到是因为model.eval()会影响继承nn.module类的self.方法的训练和测试,但是F.dropout更像是一个函数没继承nn,module。

另外,回归模型在后面几层应该避免使用dropout,最多在浅层使用。

2 BCEloss归一化

在tf2中BCEloss没有归一化,但是在torch中的损失函数是归一化了的。

相关推荐
懈尘1 分钟前
基于Spring Boot与LangChain4j的AI驱动新闻系统设计与工程实现
java·大数据·人工智能·spring boot·后端·langchain
倔强的石头1061 分钟前
假设空间与版本空间 —— 机器学习是 “猜规律” 的过程
人工智能·机器学习
flying_13142 分钟前
图神经网络分享系列-GGNN(GATED GRAPH SEQUENCE NEURAL NETWORKS)(三)
人工智能·深度学习·神经网络·图神经网络·ggnn·门控机制·图特征学习
2301_805962932 分钟前
树莓派的一些问题记录-1:usbboot仓库
python·gitee
cooldream20093 分钟前
Agent Skill:新一代 AI 设计模式的原理、实践与 MCP 协同应用解析
人工智能·mcp·agent skill
言無咎6 分钟前
传统财务RPA陷入性能瓶颈?AI财务机器人用LLM重构智能财税
人工智能·机器人·rpa
深蓝电商API7 分钟前
Selenium 动作链 ActionChains 高级用法
爬虫·python·selenium
一休哥助手8 分钟前
2026年1月25日人工智能早间新闻
人工智能
小圣贤君10 分钟前
在 Electron 应用中优雅接入 DeepSeek AI:从零到一的完整实践指南
人工智能·electron·vue3·ai写作·deepseek
喵手14 分钟前
Python爬虫零基础入门【第八章:项目实战演练·第2节】项目 2:信息聚合站 Demo(列表+详情+增量+质量报告)!
爬虫·python·爬虫实战·python爬虫工程化实战·零基础python爬虫教学·爬虫项目演练·信息聚合站