tensorboard可视化时save_graph报错ERROR: Graphs differed across invocations!的一个解决方法

在使用tensorboard可视化,经常会将模型通过save_graph方法保存下来,方便查看结构。在使用save_graph经常会遇到错误(至少我经常遇到),对于我,最常见的一个错误为

复制代码
Tracing failed sanity checks!
ERROR: Graphs differed across invocations!
	Graph diff:
.....
First diverging operator:
	Node diff:
...

我是在模型中用了 pytorch 自带的 nn.MultiheadAttention 发生了这个错误,一个简单的解决方法是将原本的

python 复制代码
self.attn = nn.MultiheadAttention(128, 8, 0.1, batch_first=True)

中的 batch_first = True 删去,修改之后为

python 复制代码
self.attn = nn.MultiheadAttention(128, 8, 0.1)

注意删除 batch_first = True 后, 输入格式需要改为 (seq, batch, feature)。

相关推荐
查无此人byebye1 分钟前
突破性图像分词技术TiTok:32个Token实现高效图像重建与生成
人工智能
Niuguangshuo1 分钟前
DALL-E 2:从CLIP潜变量到高质量图像生成的突破
人工智能·深度学习·transformer
偷吃的耗子2 分钟前
【CNN算法理解】:基于训练好的MNIST CNN模型进行预测
人工智能·算法·cnn
Elastic 中国社区官方博客2 分钟前
跳过 MLOps:通过 Cloud Connect 使用 EIS 为自管理 Elasticsearch 提供托管云推理
大数据·数据库·人工智能·elasticsearch·搜索引擎·ai·全文检索
北京耐用通信7 分钟前
耐达讯自动化Profinet转Devicenet网关:精细化工行业的“协议融合利器”
人工智能·物联网·网络协议·自动化·信息与通信
做萤石二次开发的哈哈12 分钟前
萤石云广播:智能语音广播,一键文字下发
人工智能·语音识别
技术狂人16814 分钟前
2026 智能体深度解析:落地真相、红利赛道与实操全指南(调研 100 + 案例干货)
人工智能·职场和发展·agent·商机
Bruk.Liu18 分钟前
(LangChain实战12):LangChain中的新型Chain之create_sql_query_chain
数据库·人工智能·sql·langchain
学电子她就能回来吗20 分钟前
深度学习速成:模型的使用与修改,保存与读取
人工智能·深度学习
友思特 智能感知23 分钟前
友思特案例 | 金属行业视觉检测案例四:挖掘机钢板表面光学字符识别(OCR)检测
人工智能·视觉检测·深度学习视觉检测