7-1 深度学习硬件:CPU和GPU


L 3 L3 L3、 L 2 L2 L2、 L 1 L1 L1为cache,数据只有进入寄存器的时候,才能开始运算。

(此图错误,一个矩阵应该是按存储的!)


  • GPU的核要远远多于CPU,从而TFLOPS,GPU每秒能做的浮点运算要远远多于CPU
  • GPU的内存和带宽要比CPU大得多

CPU和GPU之间并不是独立的,因为任务其实都是跑在CPU上的。


相关推荐
财经资讯数据_灵砚智能1 分钟前
基于全球经济类多源新闻的NLP情感分析与数据可视化(日间)2026年5月3日
大数据·人工智能·python·信息可视化·自然语言处理
灵机一物2 分钟前
灵机一物AI原生电商小程序、PC端(已上线)-AI产业深度解析:Token供需失衡下的算力战争与产业变革
大数据·人工智能·深度学习
MediaTea4 分钟前
ML:逻辑回归的基本原理与实现
人工智能·算法·机器学习·数据挖掘·逻辑回归
Carl_奕然4 分钟前
【大模型】Agent 之:从 Context 到 Harness 的工程革命
人工智能·计算机视觉·自然语言处理
wayz115 分钟前
Day 19:LSTM与时间序列预测
人工智能·深度学习·lstm
索木木9 分钟前
Flash Attention反向梯度优化显存
人工智能·机器学习·大模型·attention·训练·显存优化·aiinfra
mit6.82411 分钟前
[CS153]AI基础设施与技术栈
人工智能
量子-Alex12 分钟前
【大模型智能体】AutoFlow:大型语言模型代理的自动化工作流生成
人工智能·语言模型·自动化
Wzx19801212 分钟前
cozen平台开发智能体
人工智能
GISer_Jing12 分钟前
AI原生前端工程化进阶实践:从流式交互架构到端云协同全链路落地
前端·人工智能·后端·学习