7-1 深度学习硬件:CPU和GPU


L 3 L3 L3、 L 2 L2 L2、 L 1 L1 L1为cache,数据只有进入寄存器的时候,才能开始运算。

(此图错误,一个矩阵应该是按存储的!)


  • GPU的核要远远多于CPU,从而TFLOPS,GPU每秒能做的浮点运算要远远多于CPU
  • GPU的内存和带宽要比CPU大得多

CPU和GPU之间并不是独立的,因为任务其实都是跑在CPU上的。


相关推荐
赫尔·普莱蒂科萨·帕塔5 分钟前
“共享”机器人
人工智能·机器人·agi
duyinbi751710 分钟前
改进YOLO13模型:C3k2与PPA优化在油田工人安全装备检测与行为识别中的应用
人工智能·安全·目标跟踪
Duang007_22 分钟前
【LeetCodeHot100 超详细Agent启发版本】两数之和 (Two Sum)
java·人工智能·python
Ydwlcloud31 分钟前
AWS 2026折扣活动深度解析:寻找最大优惠的智慧路径
大数据·服务器·人工智能·云计算·aws
NingboWill32 分钟前
AI日报 - 2026年01月14日
人工智能
QYR_1134 分钟前
聚偏二氟乙烯(PVDF)行业市场深度调研与投资前景预测报告2026版
大数据·人工智能
2401_8322981037 分钟前
芯片级机密计算,天翼云CSV3筑牢数据“可用不可见”防线
大数据·网络·人工智能
Java后端的Ai之路41 分钟前
【AI大模型开发】-Embedding 与向量数据库:从基础概念到实战应用
数据库·人工智能·embedding·向量数据库·ai应用开发工程师
我想发发发43 分钟前
已经安装了ROS环境却还是报错`ModuleNotFoundError: No module named ‘rclpy‘`
前端·人工智能·chrome·机器人
OJAC1111 小时前
近屿智能荣获搜狐教育「2025年度人工智能影响力教育品牌」
人工智能