GPU加速与非加速的深度学习张量计算对比Demo,使用PyTorch展示关键差异

import torch

import time

创建大型随机张量 (10000x10000)

tensor_size = 10000

x_cpu = torch.randn(tensor_size, tensor_size)

x_gpu = x_cpu.cuda() # 转移到GPU

CPU矩阵乘法

start = time.time()

result_cpu = torch.mm(x_cpu, x_cpu.t())

cpu_time = time.time() - start

GPU矩阵乘法

torch.cuda.synchronize() # 确保GPU计时准确

start = time.time()

result_gpu = torch.mm(x_gpu, x_gpu.t())

torch.cuda.synchronize()

gpu_time = time.time() - start

print(f"CPU计算时间: {cpu_time:.4f}秒")

print(f"GPU计算时间: {gpu_time:.4f}秒")

print(f"加速比: {cpu_time/gpu_time:.1f}倍")

相关推荐
摸鱼仙人~2 分钟前
Minstrel:多智能体协作生成结构化 LangGPT 提示词
人工智能·提示词
AI街潜水的八角1 小时前
深度学习图像分类数据集—濒危动物识别分类
人工智能·深度学习
安思派Anspire1 小时前
LangGraph + MCP + Ollama:构建强大代理 AI 的关键(一)
前端·深度学习·架构
程序员陆通1 小时前
独立开发A/B测试实用教程
人工智能·ai编程
knowfoot1 小时前
硬核拆解!跟着公式“走”一遍,你也能彻底看懂神经网络
人工智能·神经网络
FF-Studio1 小时前
大语言模型(LLM)课程学习(Curriculum Learning)、数据课程(data curriculum)指南:从原理到实践
人工智能·python·深度学习·神经网络·机器学习·语言模型·自然语言处理
DDDDDouble1 小时前
<二>Sping-AI alibaba 入门-记忆聊天及持久化
java·人工智能
PyAIExplorer1 小时前
图像处理中的插值方法:原理与实践
图像处理·人工智能
狗头大军之江苏分军2 小时前
疑似华为盘古AI大模型翻车造假风波【实时记录篇】
人工智能·机器学习·程序员
Mr.Winter`2 小时前
轨迹优化 | 基于激光雷达的欧氏距离场ESDF地图构建(附ROS C++仿真)
c++·人工智能·机器人·自动驾驶·ros·ros2·具身智能