一、定义
- cuda 缓存示意图
- gpu 架构示意图
- gpu 内存访问示意图
二、实现
- cuda 缓存示意图
DRAM: 通常指的是GPU的显存,位于GPU芯片外部,通过某种接口(如PCIE)与GPU芯片相连。它是GPU访问的主要数据存储区域,用于存储大量的数据。
L1: 缓存位于GPU芯片内部,靠近计算核心。L1缓存通常直接集成在每个计算单元(如流多处理器SM)内部。
L2: 缓存位于GPU芯片内部,靠近计算核心。L2缓存则可能被多个计算单元共享。
速度: L1>L2>DRAM
容量: L1<<L2<DRAM - gpu 架构示意图
- gpu 内存访问示意图