pytorch基本运算-分离计算

【1】引言

前序学习进程中,已经对pytor求导有了基本认识,知道requires_grad_(True)和backward()是求导必备的声明。

但有一种特殊情况,如果变量 z = f ( x y ) z=f(xy) z=f(xy),但同时 y = f ( x ) y=f(x) y=f(x),也就是变量 y y y是变量 x x x的函数,变量 z z z同时是变量 y y y和变量 x x x的函数,此时可以有表达式:
z = f ( x y ) = f ( x ( f ( x ) ) ) z=f(xy)=f(x(f(x))) z=f(xy)=f(x(f(x)))如果我们就是想获得 y y y计算出来后, z z z关于 x x x的导数,,此时就要考虑如何将 y y y单独分流出来,不要让梯度经过 y y y追溯到 x x x。

这就是本次要学习的重点:分离计算。

【2】detach()函数

分离计算要使用detach()函数,用一个自定义的新变量名比如 t t t来获取原变量 y y y的值,此时把 z z z的表达式改写成:
z = f ( x y ) = f ( x t ) ) z=f(xy)=f(xt)) z=f(xy)=f(xt))

此时计算 d z d x \frac{dz}{dx} dxdz就不会通过 t t t传递到 x x x, t t t只是一个和 y y y相等的常数。

为此找一个例子做测试。

python 复制代码
# 引入模块
import torch
from torch.autograd import backward

# 定义初始张量
x=torch.arange(5.0)
# 声明要对x求导
z=x.requires_grad_(True)
print('z=',z)
# 乘积定义
y=x*x
z=y*x
# 梯度计算
z.sum().backward()
print('z=',z)
# 此时没有单独提取y
g1=x.grad
print('g1=',g1)
# 梯度清零
x.grad.zero_()
# 使用t分离y
t=y.detach()
# 重新定义函数
z=t*x
# 计算梯度
z.sum().backward()
print('z=',z)
# g2是用t分离y后获得的梯度
g2=x.grad
print('g2=',g2)
# 理论上,根据z=t*x,如果t是一个常数,梯度结果就是t
print('t=',t)

这个代码块先计算了不分离 y y y的梯度 g 1 g1 g1,然后计算了分离 y y y的梯度 g 2 g2 g2,证明了分离后确实梯度计算不会再由 t t t追溯到 x x x,实现了保持 y y y为常数的运算目标。

计算结果为:

【3】总结

学习了pytorch分离计算导数的基本概念。

相关推荐
qq_171538851 小时前
医者仁心:医生职业全景解析
人工智能
漫游的渔夫1 小时前
前端开发者做 Agent:别写成一次请求,用 5 步受控循环防止 AI 乱跑
前端·人工智能·typescript
eastyuxiao1 小时前
影响 OpenClaw 自动处理效率的核心因素
开发语言·人工智能
Luca_kill2 小时前
GPT Image 2 深度评测:当 AI 图像生成跨越“图灵测试”,它如何重塑开发者工作流?
人工智能·深度学习·openai·ai图像生成·gpt image 2
GIS数据转换器2 小时前
“一张图”背景下的地质灾害监测预警与防治能力建设
大数据·人工智能·数据分析·无人机·智慧城市
nbwenren2 小时前
2026技术实战:用ChatGPT将百份文档变成“可对话知识库”(国内直访方案详解)
人工智能
时空系2 小时前
第13篇:综合实战——制作我的小游戏 python中文编程
开发语言·python·ai编程
Elastic 中国社区官方博客2 小时前
在 Elastic 中使用 MCP 自动化用户旅程以进行合成监控
大数据·运维·人工智能·elasticsearch·搜索引擎·自动化·可用性测试
ComputerInBook2 小时前
数字图像处理(4版)——第 8 章——图像压缩与水印(上)(Rafael C.Gonzalez&Richard E. Woods)
人工智能·算法·计算机视觉·图像压缩·图像水印