GPU架构

以下为GPU的内部结构图,图片来自于[1](#1)

GPU由多个GPU处理集群(GPC)构成,每个GPC由纹理处理集群(TPC)构成,每个TPC由多个流多处理(SM)构成.

GPU的最基本的处理单元位于SM中。

SM的结构如下:

英文架构图[2](#2)

一个SM中可以并行多个线程。通过线程束调度器进行软件层面控制,通过分配单元将线程分配到具体的计算单元中。

计算单元分为int、FP32、FP64以及Tensor Core。

对应的功能结构如下:

详细的内容可以查看视频[3](#3)

参考链接


  1. V100GPU架构 ↩︎

  2. volta-architecture-whitepaper ↩︎

  3. # GPU硬件架构与CUDA如何对应 ↩︎

相关推荐
艾莉丝努力练剑41 分钟前
跨节点通信优化:使用hixl降低网络延迟的实战
架构·cann
程序猿追1 小时前
深度解读 CANN HCCL:揭秘昇腾高性能集体通信的同步机制
神经网络·架构
程序员泠零澪回家种桔子1 小时前
Spring AI框架全方位详解
java·人工智能·后端·spring·ai·架构
GIOTTO情1 小时前
舆情监测系统选型与技术落地:Infoseek 字节探索全栈架构解析与实战
架构
island13142 小时前
CANN ops-nn 算子库深度解析:神经网络计算引擎的底层架构、硬件映射与融合优化机制
人工智能·神经网络·架构
C澒2 小时前
前端整洁架构(Clean Architecture)实战解析:从理论到 Todo 项目落地
前端·架构·系统架构·前端框架
roman_日积跬步-终至千里2 小时前
【架构实战-Spring】动态数据源切换方案
架构
C澒2 小时前
Remesh 框架详解:基于 CQRS 的前端领域驱动设计方案
前端·架构·前端框架·状态模式
晚霞的不甘3 小时前
CANN 编译器深度解析:UB、L1 与 Global Memory 的协同调度机制
java·后端·spring·架构·音视频
C澒3 小时前
前端分层架构实战:DDD 与 Clean Architecture 在大型业务系统中的落地路径与项目实践
前端·架构·系统架构·前端框架