tensorboard可视化时save_graph报错ERROR: Graphs differed across invocations!的一个解决方法

在使用tensorboard可视化,经常会将模型通过save_graph方法保存下来,方便查看结构。在使用save_graph经常会遇到错误(至少我经常遇到),对于我,最常见的一个错误为

复制代码
Tracing failed sanity checks!
ERROR: Graphs differed across invocations!
	Graph diff:
.....
First diverging operator:
	Node diff:
...

我是在模型中用了 pytorch 自带的 nn.MultiheadAttention 发生了这个错误,一个简单的解决方法是将原本的

python 复制代码
self.attn = nn.MultiheadAttention(128, 8, 0.1, batch_first=True)

中的 batch_first = True 删去,修改之后为

python 复制代码
self.attn = nn.MultiheadAttention(128, 8, 0.1)

注意删除 batch_first = True 后, 输入格式需要改为 (seq, batch, feature)。

相关推荐
码农三叔几秒前
(9-2-01)电源管理与能源系统:能耗分析与功率管理(1)步行能耗估计
人工智能·嵌入式硬件·机器人·人机交互·能源·人形机器人
SmartRadio5 分钟前
ESP32-S3对接豆包制作AI桌面数字收音机,桌面闹钟,桌面新闻播报器
人工智能·esp32·远程·虚拟键盘·虚拟鼠标
主机哥哥7 分钟前
阿里云OpenClaw极简部署教程,打造专属AI助手!
人工智能·阿里云·云计算
AI营销快线8 分钟前
决胜2026:原圈科技AI CRM系统如何领跑汽车销服一体化变革?
人工智能
qwy71522925816312 分钟前
13-图像的透视
人工智能·opencv·计算机视觉
光羽隹衡12 分钟前
计算机视觉——Opencv(图像直方图与掩膜)
人工智能·opencv·计算机视觉
KG_LLM图谱增强大模型14 分钟前
a16z 最新AI市场状态报告:独角兽崛起与科技超级周期
人工智能
xixixi7777716 分钟前
Prompt脱敏——不损失(或尽量少损失)原文本语义和上下文价值的前提下,防止原始敏感数据暴露给模型服务方、潜在的攻击者或出现在模型训练数据中
人工智能·microsoft·ai·大模型·数据安全·提示词·敏感信息
凡泰极客科技17 分钟前
新浪财经专访凡泰极客梁启鸿:金融App的AI落地应避哪些坑
人工智能·金融
量子-Alex18 分钟前
【大模型技术报告】Qwen2-VL技术报告解读
人工智能