GPU加速与非加速的深度学习张量计算对比Demo,使用PyTorch展示关键差异

import torch

import time

创建大型随机张量 (10000x10000)

tensor_size = 10000

x_cpu = torch.randn(tensor_size, tensor_size)

x_gpu = x_cpu.cuda() # 转移到GPU

CPU矩阵乘法

start = time.time()

result_cpu = torch.mm(x_cpu, x_cpu.t())

cpu_time = time.time() - start

GPU矩阵乘法

torch.cuda.synchronize() # 确保GPU计时准确

start = time.time()

result_gpu = torch.mm(x_gpu, x_gpu.t())

torch.cuda.synchronize()

gpu_time = time.time() - start

print(f"CPU计算时间: {cpu_time:.4f}秒")

print(f"GPU计算时间: {gpu_time:.4f}秒")

print(f"加速比: {cpu_time/gpu_time:.1f}倍")

相关推荐
图灵学术计算机论文辅导16 分钟前
论文推荐|迁移学习+多模态特征融合
论文阅读·人工智能·深度学习·计算机网络·算法·计算机视觉·目标跟踪
一百天成为python专家25 分钟前
Python循环语句 从入门到精通
开发语言·人工智能·python·opencv·支持向量机·计算机视觉
轻松Ai享生活1 小时前
GitHub Repo 骨架:Makefile + CUDA 入门程序
人工智能
用户5191495848451 小时前
对抗性工程实践:利用AI自动化构建GitHub仓库的虚假提交历史
人工智能·aigc
riveting1 小时前
重塑工业设备制造格局:明远智睿 T113-i 的破局之道
人工智能·物联网·制造·t113·明远智睿
zzywxc7872 小时前
详细探讨AI在金融、医疗、教育和制造业四大领域的具体落地案例,并通过代码、流程图、Prompt示例和图表等方式展示这些应用的实际效果。
开发语言·javascript·人工智能·深度学习·金融·prompt·流程图
算家计算2 小时前
32K上下文开源语音理解、40分钟深度交互——Voxtral-Small-24B-2507本地部署教程
人工智能·开源·aigc
聚客AI2 小时前
📝工程级开源:PyTorch手搓LLaMA4-MoE全栈指南
人工智能·llm·掘金·日新计划
TechubNews2 小时前
加密资产投资的六种策略:稳定币合规后的 Web3 投资和 RWA
人工智能·web3
机器之心2 小时前
7年了,OpenAI官方给出五代GPT对比,网友却怀念起「狂野」初代
人工智能·openai