注意pytorch的原地操作

常见的原地操作:nn.ReLu(inplace=True)

python 复制代码
a = torch.randn(2)	# tensor([-0.3690,  0.0626])
b = a.clone() # tensor([-0.3690,  0.0626])
c = a	# tensor([-0.3690,  0.0626])
relu = nn.ReLu(inplace=True)

情况1

python 复制代码
out = relu(a) # tensor([0.0000, 0.0626])
a	# tensor([0.0000, 0.0626])
b	# tensor([-0.3690,  0.0626])
c	# tensor([0.0000, 0.0626])

如果没有clone, c则会变化

情况2

python 复制代码
out1 = a + relu(a)	# tensor([-0.3690, 0.1252])
out2 = relu(a) + a	# tensor([0, 0.1252])

两个完全不同结果

相关推荐
运维@小兵几秒前
Spring AI入门
java·人工智能·spring
Python_Study20252 分钟前
制造业企业如何构建高效数据采集系统:从挑战到实践
大数据·网络·数据结构·人工智能·架构
丝斯20112 分钟前
AI学习笔记整理(47)——大模型企业应用技术之提示工程
人工智能·笔记·学习
媒体人8882 分钟前
GEO优化专家孟庆涛:生成式AI时代的营销革命与未来
人工智能·电脑·生成式引擎优化·geo优化
知乎的哥廷根数学学派5 分钟前
基于多分辨率注意力脉冲神经网络的机械振动信号故障诊断算法(西储大学轴承数据,Pytorch)
人工智能·pytorch·深度学习·神经网络·算法·机器学习
知识图谱LLM13 分钟前
【关于多模态情感识别数据集的报告】
人工智能·自然语言处理·语音识别
deephub13 分钟前
CALM模型的黑盒采样:用碰撞方法实现温度调节
人工智能·大语言模型·采样
Coder_Boy_14 分钟前
基于SpringAI的在线考试系统软件系统验收案例
人工智能·spring boot·软件工程·devops
老蒋每日coding15 分钟前
AI智能体设计模式系列(二)—— 路由模式
人工智能·设计模式
kebijuelun16 分钟前
Qwen 团队提出 ArenaRL:面向开放式 Agent RL 任务
人工智能·算法·语言模型·transformer