AI编程: 一个案例对比CPU和GPU在深度学习方面的性能差异

背景

字节跳动正式发布中国首个AI原生集成开发环境工具(AI IDE)------AI编程工具Trae国内版。 该工具模型搭载doubao-1.5-pro,支持切换满血版DeepSeek R1&V3, 可以帮助各阶段开发者与AI流畅协作,更快、更高质量地完成编程工作,提升开发效率。

安装试用后,效果确实不错,无论是编程还是开发环境的自动化构建,都能实现较高程度的自动化。

本文演示了一个实际编程案例,在一台配备Intel CPU和集成显卡的个人PC上,对比GPU/CPU在一些耗时运算方面的性能差异,并通过图表展示对比结果。涉及基本的神经网络模型 编程,如python环境配置、矩阵运算、前向传播、反向传播,基于Intel集成显卡GPU的开发环境配置等。

运行环境

builder模式实施任务

向Trae描述任务需求

本机是 i7-1260P + Iris Xe + 16G内存, 请编写程序,对比一下使用CPU和GPU进行某些深度学习运算的性能差异。

只需根几秒的时间, trae就已经完成了代码编写 gpu_cpu_benchmark.py,并输出了python环境依赖库清单requirements.txt

生成依赖并自动安装

requirements.txt如下图所示,当然,依赖文件并不是一步到位 直接生成的。而是经历了多个版本的叠代。

比如 ,一开始trae推荐的是以下版本的torch

复制代码
pip install torch==2.3.0 torchvision==0.18.0 intel-extension-for-pytorch==2.3.0 memory-profiler==0.61

但是因版本匹配问题失败,因此, trace又调整了软件包版本。

包括在使用intel集成显卡的时候与Nvidia GPU编程不同, trae提示:

检测到PyTorch安装需要额外源地址,现在添加Intel官方源重新安装依赖。

复制代码
pip install -r requirements.txt --extra-index-url https://pytorch-extension.intel.com/release-whl/stable/xpu/us/

评测程序运行

测评程序分别使用cpu、XPU(即intel的集成显卡)进行矩阵运算、前向传播、反向传播等方面的运算。

GPU满负荷工作:

评测结果

评测程序最终自动输出了评测结果,如下图所示。结果表明, 这台集成显卡的GPU性能实在一般, 只有矩阵运算比CPU强,其他方面如前向传播、反向传播和内存使用,都比CPU要弱。后续有机会换个显卡再试。

这台集成显卡的GPU性能实在一般, 只有矩阵运算比CPU强,其他方面如前向传播、反向传播和内存使用,都比CPU要弱。后续有机会换个显卡再试。

相关推荐
shao918516几秒前
Gradio全解20——Streaming:流式传输的多媒体应用(6)——RT-DETR模型构建视频流目标检测系统
人工智能·gradio·streaming·rt-detr·视频流目标检测·rt-detrv2
周周记笔记6 分钟前
【统计学基础】随机抽样的特点
人工智能
金融小师妹22 分钟前
AI技术视角:美联储信号与黄金动态的量化研究——基于多模态数据分析框架
大数据·人工智能·算法
jndingxin33 分钟前
OpenCV 图形API(80)图像与通道拼接函数-----仿射变换函数warpAffine()
人工智能·opencv·计算机视觉
檀越剑指大厂35 分钟前
Windows系统安装Cursor与远程调用本地模型QWQ32B实现AI辅助开发
人工智能·windows
Debroon37 分钟前
中科院开源:多智能体 + 知识图谱,自动生成高质量医学数据
人工智能·知识图谱
巷95538 分钟前
深度学习模型的部署实践与Web框架选择
前端·人工智能·深度学习
jndingxin39 分钟前
OpenCV 图形API(79)图像与通道拼接函数-----将一个三通道的 GMat 图像拆分为三个单独的单通道 GMat函数split3()
人工智能·opencv·计算机视觉
昊昊该干饭了1 小时前
拆解 Prompt 工程:五大场景驱动 DeepSeek 超越 ChatGPT
人工智能·自然语言处理·chatgpt·ai作画·gpt-3·文心一言
说私域1 小时前
数字化驱动下的智慧物流与零售创新:全流程无人仓与定制开发开源AI智能名片S2B2C商城小程序的协同实践
人工智能·小程序·开源·零售