PyTorch踩坑记录1

1 model.eval()无法关闭dropout

因为model.eval()控制self.training参数,只有用nn.Dropout(0.5)声明才能在调用model.eval()后关闭,用F.dropout(x, p=0.5)是没办法自动关闭的,需要手动把self.training的参数传入到F.dropout()里才行。

网上查到是因为model.eval()会影响继承nn.module类的self.方法的训练和测试,但是F.dropout更像是一个函数没继承nn,module。

另外,回归模型在后面几层应该避免使用dropout,最多在浅层使用。

2 BCEloss归一化

在tf2中BCEloss没有归一化,但是在torch中的损失函数是归一化了的。

相关推荐
杭州华望MBSE几秒前
AI应用园地(1)| AI驱动需求工程升级—条目化、模型化、追溯化的三位一体实践
大数据·人工智能·mbse·sysml·ai助手
运维小欣3 分钟前
AI可观测厂商选型指南(2026版)
人工智能
2301_818527786 分钟前
瑜伽服供应链优化——AI让每一件都准时高品质交付
人工智能
调试优选官8 分钟前
2026上海AI搜索GEO优化:技术路径与服务能力全景梳理
人工智能·ai·geo·上海
2601_9551350310 分钟前
AI音乐生态客服成本2026分析
大数据·人工智能
云烟成雨TD13 分钟前
Spring AI Alibaba 1.x 系列【80】可观测集成
java·人工智能·spring
渡码桑21 分钟前
STM32 TinyML实战2026:3步在单片机上跑通AI推理——从TensorFlow到Edge Impulse的嵌入式进化
人工智能·stm32·单片机
chian-ocean24 分钟前
突破纯文字交互:基于魔珐星云端到端技术,赋能国产大模型构建数字人智能体
人工智能·交互·语音识别
暗夜猎手-大魔王24 分钟前
hermes源码学习8--Gateway 内部机制
人工智能·gateway
console.log('npc')27 分钟前
将 Figma 接入 Codex MCP:从 `/plugins` 到本地插件配置的完整教程
前端·人工智能·python·figma·code·codex·mcp