GPU架构

以下为GPU的内部结构图,图片来自于[1](#1)

GPU由多个GPU处理集群(GPC)构成,每个GPC由纹理处理集群(TPC)构成,每个TPC由多个流多处理(SM)构成.

GPU的最基本的处理单元位于SM中。

SM的结构如下:

英文架构图[2](#2)

一个SM中可以并行多个线程。通过线程束调度器进行软件层面控制,通过分配单元将线程分配到具体的计算单元中。

计算单元分为int、FP32、FP64以及Tensor Core。

对应的功能结构如下:

详细的内容可以查看视频[3](#3)

参考链接


  1. V100GPU架构 ↩︎

  2. volta-architecture-whitepaper ↩︎

  3. # GPU硬件架构与CUDA如何对应 ↩︎

相关推荐
刀法如飞25 分钟前
DDD 与 Ontology 对比分析:哪一种更适合AI时代复杂系统构建?
java·架构·领域驱动设计
2601_9545267532 分钟前
底层架构与并发性能:多态胶原饮“竞品对比”的技术评估报告
架构
500841 小时前
Conv + BN + ReLU 融合:省掉两次显存读写
flutter·架构·开源·wpf·音视频
计算机魔术师4 小时前
【AI面试八股文 Vol.3.4:训练微调部署选型】从预训练到量化部署:LLM 工程落地如何做模型选择
人工智能·后端·面试·架构·moe·vol.3.3·vol.3.4
therese_100864 小时前
客户端设计(下):场景流派与实战设计方式
架构·安卓·鸿蒙
乌恩大侠5 小时前
基站正在成为 AI 计算节点:NVIDIA Aerial 推动 RAN 架构重构
人工智能·重构·架构
码点滴6 小时前
CRI-O选型与容器运行时标准
开发语言·人工智能·架构·kubernetes·cri-o
Joy T7 小时前
【Web3】跨链 NFT 工程化实战:多环境配置与自动化状态查询机制
架构·web3·区块链·智能合约·hardhat·hardhat 3.x·跨链测试
500847 小时前
ATC 做了什么:从 ONNX 到 .om
分布式·架构·开源·wpf·开源鸿蒙
雨辰AI7 小时前
完整版信创微服务国产化架构实战:Nacos+Seata+Redis + 人大金仓(生产可落地)
数据库·redis·微服务·架构·政务