7-1 深度学习硬件:CPU和GPU


L 3 L3 L3、 L 2 L2 L2、 L 1 L1 L1为cache,数据只有进入寄存器的时候,才能开始运算。

(此图错误,一个矩阵应该是按存储的!)


  • GPU的核要远远多于CPU,从而TFLOPS,GPU每秒能做的浮点运算要远远多于CPU
  • GPU的内存和带宽要比CPU大得多

CPU和GPU之间并不是独立的,因为任务其实都是跑在CPU上的。


相关推荐
网易伏羲3 分钟前
网易伏羲亮相Arm Unlocked 2025,携手Arm探索中国人工智能创新之路
人工智能·游戏ai·网易伏羲
寒月霜华15 分钟前
机器学习ML-简介、数据获取、网页数据抓取
人工智能·机器学习
程序猿阿伟26 分钟前
《AI游戏开发中的隐性困境:从战斗策略失效到音效错位的深度破局》
人工智能
gooxi_hui1 小时前
8卡直连,Turin加持!国鑫8U8卡服务器让生成式AI落地更近一步
大数据·人工智能
范男1 小时前
YOLO11目标检测运行推理简约GUI界面
图像处理·人工智能·yolo·计算机视觉·视觉检测
搜搜秀1 小时前
内存传输速率MT/s
人工智能·自然语言处理·机器翻译
天下无敌笨笨熊2 小时前
一些常用的激活函数及绘图
深度学习
向成科技2 小时前
XC3588N工控主板助力电力巡检机器人
人工智能·rk3588·安卓·硬件·工控主板·主板
taxunjishu2 小时前
DeviceNet 转 EtherCAT:发那科焊接机器人与倍福 CX5140 在汽车焊装线的高速数据同步通讯配置案例
人工智能·区块链·工业物联网·工业自动化·总线协议
sali-tec2 小时前
C# 基于halcon的视觉工作流-章33-矩状测量
开发语言·人工智能·算法·计算机视觉·c#