tensorboard可视化时save_graph报错ERROR: Graphs differed across invocations!的一个解决方法

在使用tensorboard可视化,经常会将模型通过save_graph方法保存下来,方便查看结构。在使用save_graph经常会遇到错误(至少我经常遇到),对于我,最常见的一个错误为

复制代码
Tracing failed sanity checks!
ERROR: Graphs differed across invocations!
	Graph diff:
.....
First diverging operator:
	Node diff:
...

我是在模型中用了 pytorch 自带的 nn.MultiheadAttention 发生了这个错误,一个简单的解决方法是将原本的

python 复制代码
self.attn = nn.MultiheadAttention(128, 8, 0.1, batch_first=True)

中的 batch_first = True 删去,修改之后为

python 复制代码
self.attn = nn.MultiheadAttention(128, 8, 0.1)

注意删除 batch_first = True 后, 输入格式需要改为 (seq, batch, feature)。

相关推荐
AI架构师易筋2 分钟前
AI学习路径全景指南:从基础到工程化的资源与策略
人工智能·学习
计算机毕业设计指导2 分钟前
基于深度学习的车牌识别系统
人工智能·深度学习
九章算科研服务13 分钟前
九章算 JACS 解读-重庆大学黄建峰教授课题组:基于柯肯达尔效应构筑Cu/Ru异质界面空腔结构,用于高效NO3−电还原制NH3
人工智能·科研·dft计算·科研服务·硕博
Hcoco_me20 分钟前
大模型面试题27:Muon优化器小白版速懂
人工智能·rnn·自然语言处理·lstm·word2vec
过期的秋刀鱼!20 分钟前
机器学习-逻辑回归的成本函数
人工智能·机器学习·逻辑回归
haiyu_y20 分钟前
Day 54 Inception 网络及其思考
人工智能·pytorch·深度学习
老吴学AI23 分钟前
第二篇:智能五层模型:定义你的AI应用战略高度
大数据·人工智能·aigc
deephub25 分钟前
从贝叶斯视角解读Transformer的内部几何:mHC的流形约束与大模型训练稳定性
人工智能·深度学习·神经网络·transformer·残差链接
CoderJia程序员甲25 分钟前
2025年度总结之-如何构建 2025 专属的 GitHub AI 项目情报库
人工智能·ai·大模型·github·ai教程
麦德泽特26 分钟前
基于ESP32S3芯片的机器人控制器设计与实现
人工智能·物联网·机器人·esp32·芯片