GAN的loss为nan的解决办法(成功)

跑了好几个GAN模型,一运行loss就巨大,几次epoch后就变NaN,或者直接就爆掉

有人说loss为nan是因为里面有log出问题了,但我想着文章里给的代码肯定得是能跑的啊

后来换了个电脑,重新把cyclegan的源码跑了一下,又完全好了

震惊!

后来我对比了一下底层,发现能跑通的这个跟其他的连conv2d的底层都不一样,所以判断是package的版本不一样

于是我把所有其他GAN代码的环境都变成能跑通的这个

其他的GAN也就都能跑通了

相关推荐
kkcodeer15 分钟前
大模型Prompt原理、编写原则与技巧以及衡量方法
人工智能·prompt·ai大模型
DevSecOps选型指南25 分钟前
SBOM风险预警 | NPM前端框架 javaxscript 遭受投毒窃取浏览器cookie
前端·人工智能·前端框架·npm·软件供应链安全厂商·软件供应链安全工具
rocksun28 分钟前
MCP利用流式HTTP实现实时AI工具交互
人工智能·mcp
xiaok1 小时前
docker network create langbot-network这条命令在dify输入还是在langbot中输入
人工智能
It_张1 小时前
LLM(大语言模型)的工作原理 图文讲解
人工智能·语言模型·自然语言处理
Darach1 小时前
坐姿检测Python实现
人工智能·python
xiaok1 小时前
LangBot 和消息平台均运行在 Docker 容器中
人工智能
queeny1 小时前
Datawhale AI夏令营 科大讯飞AI大赛(大模型技术) Task3 心得
人工智能
ToTensor1 小时前
Paraformer实时语音识别中的碎碎念
人工智能·语音识别·xcode