GPU加速与非加速的深度学习张量计算对比Demo,使用PyTorch展示关键差异

import torch

import time

创建大型随机张量 (10000x10000)

tensor_size = 10000

x_cpu = torch.randn(tensor_size, tensor_size)

x_gpu = x_cpu.cuda() # 转移到GPU

CPU矩阵乘法

start = time.time()

result_cpu = torch.mm(x_cpu, x_cpu.t())

cpu_time = time.time() - start

GPU矩阵乘法

torch.cuda.synchronize() # 确保GPU计时准确

start = time.time()

result_gpu = torch.mm(x_gpu, x_gpu.t())

torch.cuda.synchronize()

gpu_time = time.time() - start

print(f"CPU计算时间: {cpu_time:.4f}秒")

print(f"GPU计算时间: {gpu_time:.4f}秒")

print(f"加速比: {cpu_time/gpu_time:.1f}倍")

相关推荐
那个村的李富贵14 小时前
光影魔术师:CANN加速实时图像风格迁移,让每张照片秒变大师画作
人工智能·aigc·cann
腾讯云开发者16 小时前
“痛点”到“通点”!一份让 AI 真正落地产生真金白银的实战指南
人工智能
CareyWYR16 小时前
每周AI论文速递(260202-260206)
人工智能
hopsky17 小时前
大模型生成PPT的技术原理
人工智能
禁默17 小时前
打通 AI 与信号处理的“任督二脉”:Ascend SIP Boost 加速库深度实战
人工智能·信号处理·cann
心疼你的一切18 小时前
昇腾CANN实战落地:从智慧城市到AIGC,解锁五大行业AI应用的算力密码
数据仓库·人工智能·深度学习·aigc·智慧城市·cann
AI绘画哇哒哒18 小时前
【干货收藏】深度解析AI Agent框架:设计原理+主流选型+项目实操,一站式学习指南
人工智能·学习·ai·程序员·大模型·产品经理·转行
数据分析能量站18 小时前
Clawdbot(现名Moltbot)-现状分析
人工智能
那个村的李富贵18 小时前
CANN加速下的AIGC“即时翻译”:AI语音克隆与实时变声实战
人工智能·算法·aigc·cann
二十雨辰18 小时前
[python]-AI大模型
开发语言·人工智能·python