7-1 深度学习硬件:CPU和GPU


L 3 L3 L3、 L 2 L2 L2、 L 1 L1 L1为cache,数据只有进入寄存器的时候,才能开始运算。

(此图错误,一个矩阵应该是按存储的!)


  • GPU的核要远远多于CPU,从而TFLOPS,GPU每秒能做的浮点运算要远远多于CPU
  • GPU的内存和带宽要比CPU大得多

CPU和GPU之间并不是独立的,因为任务其实都是跑在CPU上的。


相关推荐
Brianna Home5 分钟前
从“码农”到“导演”:AI结对编程如何重塑软件工程范式
大数据·人工智能·深度学习·自然语言处理·chatgpt
oe10196 分钟前
实测Triton-Copilot:AI如何助力高性能算子开发
人工智能·pytorch·copilot·vibecoding·flagos
IT_陈寒12 分钟前
JavaScript性能优化:3个被低估的V8引擎技巧让你的代码提速50%
前端·人工智能·后端
hazy1k29 分钟前
K230基础-录放音频
人工智能·stm32·单片机·嵌入式硬件·音视频·k230
众趣科技2 小时前
数字孪生重构智慧园区:众趣科技何以成为 VR 园区领域标杆
人工智能·3d·智慧城市·空间计算
心勤则明2 小时前
Spring AI 会话记忆实战:从内存存储到 MySQL + Redis 双层缓存架构
人工智能·spring·缓存
ARM+FPGA+AI工业主板定制专家5 小时前
基于GPS/PTP/gPTP的自动驾驶数据同步授时方案
人工智能·机器学习·自动驾驶
长鸳词羡5 小时前
wordpiece、unigram、sentencepiece基本原理
人工智能
ㄣ知冷煖★5 小时前
【GPT5系列】ChatGPT5 提示词工程指南
人工智能
科士威传动5 小时前
丝杆支撑座在印刷设备如何精准运行?
人工智能·科技·自动化·制造