7-1 深度学习硬件:CPU和GPU


L 3 L3 L3、 L 2 L2 L2、 L 1 L1 L1为cache,数据只有进入寄存器的时候,才能开始运算。

(此图错误,一个矩阵应该是按存储的!)


  • GPU的核要远远多于CPU,从而TFLOPS,GPU每秒能做的浮点运算要远远多于CPU
  • GPU的内存和带宽要比CPU大得多

CPU和GPU之间并不是独立的,因为任务其实都是跑在CPU上的。


相关推荐
星落zx3 分钟前
Spring Boot 多模型集成:优雅调用全球主流大模型
人工智能·spring boot·chatgpt
m0_380167149 分钟前
面向开发者的Top10加密货币数据API(2026年最新)
大数据·人工智能·区块链
yyxx41212311 分钟前
上海企业如何选择专业的钉钉服务商
java·大数据·人工智能·钉钉
未来和明天12 分钟前
领嵌iLeadE-588边缘计算盒子,兼容Modbus、DLT645、OPC UA等多种行业协议,支持第三方平台对接。
人工智能·边缘计算
幂律智能21 分钟前
盖章是合同的开始,那最后一步是什么
人工智能
大山佬22 分钟前
RTOS 内存管理:从静态分配到堆碎片治理的工程实践
人工智能
chase_my_dream23 分钟前
Cartographer详细讲解
c++·人工智能·自动驾驶
AIHR数智引擎28 分钟前
KPI物理失效:AI原生组织的效能重构与技能度量
人工智能·经验分享·职场和发展·重构·ai-native·aihr
β添砖java33 分钟前
深度学习(22)网络中的网络NiN
人工智能·深度学习
昵称好难啊38 分钟前
7.OpenClaw源码解析——可靠消息投递
人工智能·llm·agent