以下为GPU的内部结构图,图片来自于[1](#1)
GPU由多个GPU处理集群(GPC)构成,每个GPC由纹理处理集群(TPC)构成,每个TPC由多个流多处理(SM)构成.
GPU的最基本的处理单元位于SM中。
SM的结构如下:
英文架构图[2](#2)
一个SM中可以并行多个线程。通过线程束调度器进行软件层面控制,通过分配单元将线程分配到具体的计算单元中。
计算单元分为int、FP32、FP64以及Tensor Core。
对应的功能结构如下:
详细的内容可以查看视频[3](#3)