tensorboard可视化时save_graph报错ERROR: Graphs differed across invocations!的一个解决方法

在使用tensorboard可视化,经常会将模型通过save_graph方法保存下来,方便查看结构。在使用save_graph经常会遇到错误(至少我经常遇到),对于我,最常见的一个错误为

复制代码
Tracing failed sanity checks!
ERROR: Graphs differed across invocations!
	Graph diff:
.....
First diverging operator:
	Node diff:
...

我是在模型中用了 pytorch 自带的 nn.MultiheadAttention 发生了这个错误,一个简单的解决方法是将原本的

python 复制代码
self.attn = nn.MultiheadAttention(128, 8, 0.1, batch_first=True)

中的 batch_first = True 删去,修改之后为

python 复制代码
self.attn = nn.MultiheadAttention(128, 8, 0.1)

注意删除 batch_first = True 后, 输入格式需要改为 (seq, batch, feature)。

相关推荐
x新观点1 分钟前
2025年IDC服务商市场观察:博大数据在第三方数据中心排名中表现稳健
大数据·人工智能·云计算
YangYang9YangYan1 分钟前
2026年中专学历考会计的证书选择路径
大数据·人工智能·学习
x新观点3 分钟前
2025年IDC服务商市场深度解析:博大数据荣登第三方数据中心排名前列
大数据·人工智能·云计算
curd_boy7 分钟前
【AI】利用语义缓存,优化AI Agent性能
人工智能·redis·缓存
DuanPenghao25 分钟前
RISCV实战:实现基于Verilator模拟蜂鸟E203的加法器和卷积神经网络仿真
人工智能·嵌入式硬件·神经网络·cnn·risc-v
一水鉴天27 分钟前
整体设计 定稿 之31 拼语言统筹表 - “归” 档位属 多轴联动(codebuddy)
人工智能·架构
智算菩萨28 分钟前
Gemini 3 Flash深度解析:Google推出的最新一代快速高效AI模型详尽性能评测报告
人工智能·aigc·gemini
智算菩萨35 分钟前
【理论讲解】深度多任务学习:概念体系、方法谱系与跨领域建模逻辑
人工智能·机器学习·多任务学习
张彦峰ZYF35 分钟前
借助DeepSeek思考产业落地:蒸馏、小模型微调
人工智能·ai·deepseek-v3·deepseek-r1·蒸馏-小模型微调
蓝鲨硬科技36 分钟前
五一视界与摩尔线程深度合作,释放物理AI进化潜能
人工智能