7-1 深度学习硬件：CPU和GPU

Alkali！2024-08-13 19:17

L 3 L3 L3、 L 2 L2 L2、 L 1 L1 L1为cache，数据只有进入寄存器的时候，才能开始运算。

（此图错误，一个矩阵应该是按行存储的！）

GPU的核要远远多于CPU，从而TFLOPS，GPU每秒能做的浮点运算要远远多于CPU
GPU的内存和带宽要比CPU大得多

CPU和GPU之间并不是独立的，因为任务其实都是跑在CPU上的。

上一篇：Bayes-Transformer-LSTM多变量时序预测 Matlab代码

下一篇：fatal: The current branch master has no upstream branch.

热门推荐

01UV安装并设置国内源 02DeepSeek更新！速览DeepSeek V3.1新特性 03KGG转MP3工具|非KGM文件|解密音频 04Qwen3-Coder 快速上手教程 | Qwen Code + Claude Code 05蜘蛛磁力搜索引擎大全，如何使用蜘蛛磁力查找磁力链接 06【2025.08.06最新版】Android Studio下载、安装及配置记录（自动下载sdk）07Claude Code VSCode集成开发指南：AI编程助手完整配置 08Spring 调试终于不再痛苦了 092025最新国内服务器可用docker源仓库地址大全（2025年8月更新）10【大模型实战篇】部署GPT-OSS-120B踩得坑（vllm / ollama等推理框架）