PyTorch 测量代码段的运行时间

Contents

timeit

  • timeit. 测量代码开始时刻和结束时刻,然后求差

  • pytorch 的代码经常会运行在 GPU 上,而在 GPU 上的运行都是异步的,意味着采用一般的 timeit 操作不能准确地得到运行时总和,因此我们一般需要用 pytorch 内置的计时工具和同步工具 (单位:ms)
python 复制代码
start = torch.cuda.Event(enable_timing=True)
end = torch.cuda.Event(enable_timing=True)

start.record()
z = x + y
end.record()

# Waits for everything to finish running
torch.cuda.synchronize()

print(start.elapsed_time(end))

profile

  • profile. pytorch 自带或者第三方的代码耗时工具

  • timeit 的方法测试一些小代码还勉强适用,但是在大规模的测试中显然会变得很麻烦,当然,你可以通过添加修饰器的方式去简化一行行重复人工添加这些时间测量代码的枯燥,但是这也并不是最好的解决方案
  • 幸运的是,pytorch 自带了 profile 用于计算模型每个部分耗时 ,其既可以计算 cpu 耗时,也可以计算 gpu 耗时
python 复制代码
x = torch.randn((1, 1), requires_grad=True)
with torch.autograd.profiler.profile(enabled=True) as prof:
	for _ in range(100):  # any normal python code, really!
    	y = x ** 2
print(prof.key_averages().table(sort_by="self_cpu_time_total"))

References

相关推荐
剑穗挂着新流苏31214 分钟前
201_深度学习的数学底座:PyTorch 线性代数与范数实战
pytorch·深度学习·线性代数
盼小辉丶18 分钟前
PyTorch实战(38)——深度学习模型可解释性
人工智能·pytorch·深度学习
香芋超新星24 分钟前
服务器根目录爆满导致 PyTorch 安装失败(Errno 28 No space left on device)
服务器·pytorch·深度学习
剑穗挂着新流苏3122 小时前
200_深度学习的地基:PyTorch 数据操作与 Pandas 预处理实战
人工智能·pytorch·python·深度学习
独隅2 小时前
MacOS 上部署 PyTorch 模型的详细步骤
人工智能·pytorch·macos
蛐蛐蛐1 天前
在openEuler(昇腾平台)上基于Conda安装CANN和PyTorch的完整过程
人工智能·pytorch·conda
fundoit1 天前
Windows 下 PyTorch 环境搭建指南
人工智能·pytorch·windows
剑穗挂着新流苏3121 天前
115_PyTorch 实战:从零搭建 CIFAR-10 完整训练与测试流水线
人工智能·pytorch·深度学习·神经网络
Fleshy数模2 天前
基于PyTorch的食品图像分类:数据增强与调优实战
人工智能·pytorch·分类
chushiyunen2 天前
大模型.safetensors文件
人工智能·pytorch·深度学习