GAN的loss为nan的解决办法(成功)

跑了好几个GAN模型,一运行loss就巨大,几次epoch后就变NaN,或者直接就爆掉

有人说loss为nan是因为里面有log出问题了,但我想着文章里给的代码肯定得是能跑的啊

后来换了个电脑,重新把cyclegan的源码跑了一下,又完全好了

震惊!

后来我对比了一下底层,发现能跑通的这个跟其他的连conv2d的底层都不一样,所以判断是package的版本不一样

于是我把所有其他GAN代码的环境都变成能跑通的这个

其他的GAN也就都能跑通了

相关推荐
zzywxc78726 分钟前
随着人工智能技术的飞速发展,大语言模型(Large Language Models, LLMs)已经成为当前AI领域最引人注目的技术突破。
人工智能·深度学习·算法·低代码·机器学习·自动化·排序算法
AI扶我青云志31 分钟前
BERT 的 NSP慢慢转换为SOP
人工智能·自然语言处理·llm
博闻录1 小时前
观远 ChatBI 完成 DeepSeek-R1 大模型适配:开启智能数据分析跃升新篇
大数据·人工智能·数据分析
掘金一周1 小时前
一文带你上手 AI Agent 编程 | 掘金一周 7.31
前端·人工智能·后端
掘金安东尼1 小时前
AI 的十年周期规律:从专家系统到大模型,下一步是什么?
人工智能
SEO_juper1 小时前
从人工到智能:SEO测试工作流的AI集成框架与ROI提升方案
人工智能·ai·chatgpt·工具·seo·数字营销
网安INF1 小时前
【论文阅读】-《RayS: A Ray Searching Method for Hard-label Adversarial Attack》
论文阅读·人工智能·深度学习·计算机视觉·网络安全·对抗攻击
walnut_oyb1 小时前
论文阅读|CVPR 2025|Mamba进一步研究|GroupMamba
论文阅读·人工智能·神经网络·计算机视觉·分类
go54631584651 小时前
离散扩散模型在数独问题上的复现与应用
线性代数·算法·yolo·生成对抗网络·矩阵
懂得节能嘛.2 小时前
【LangChain4j 详解】Java生态大语言模型框架设计哲学与架构原理
java·人工智能·语言模型