7-1 深度学习硬件:CPU和GPU


L 3 L3 L3、 L 2 L2 L2、 L 1 L1 L1为cache,数据只有进入寄存器的时候,才能开始运算。

(此图错误,一个矩阵应该是按存储的!)


  • GPU的核要远远多于CPU,从而TFLOPS,GPU每秒能做的浮点运算要远远多于CPU
  • GPU的内存和带宽要比CPU大得多

CPU和GPU之间并不是独立的,因为任务其实都是跑在CPU上的。


相关推荐
xwill*几秒前
3D-GENERALIST: Vision-Language-Action Models for Crafting 3D Worlds
人工智能·pytorch·python·深度学习
serve the people2 分钟前
tensorflow tf.Module 的检查点Checkpoint机制
人工智能·python·tensorflow
源码方舟3 分钟前
【AI是否能替代IT从业者?】
人工智能
茶杯6756 分钟前
极睿iClip易视频——电商短视频智能运营的革新者
大数据·人工智能
蛋王派7 分钟前
深度解析 Qwen大语言模型流程:全流程算子逻辑与维度变换详解
深度学习·机器学习·自然语言处理
Dev7z8 分钟前
基于MATLAB的风向和天气条件下污染物扩散模拟与可视化系统
人工智能·算法·matlab
LUU_7910 分钟前
Day26 评价问题介绍
人工智能·python
fantasy_arch10 分钟前
残差网络模型demo
网络·深度学习·神经网络
韩曙亮11 分钟前
【自动驾驶】Autoware 三大版本 ( Autoware.AI | Autoware.Auto | Autoware Core/Universe )
人工智能·机器学习·自动驾驶·autoware·autoware.ai·autoware.auto
Bol526111 分钟前
「“嵌”入未来,“式”界无限」从智能家居到工业4.0,从可穿戴设备到自动驾驶,嵌入式技术正以前所未有的深度和广度,悄然重塑我们的世界
人工智能·自动驾驶·智能家居