GPU微架构

GPU微架构

第一章 GPU架构设计的目标


文章目录


GPU与多线程

GPU与CPU架构的典型特征在于并行计算,以及计算控制方法

GPU采用多线程架构的原因

  • 处理需求具有一致性(最典型的属于渲染管线:典型的渲染过程包括)
  • 针对AI计算便于多粒度组合计算(一方面支持多Batch;另一方面支持变化规模,例如feature size的变化或者MatMul的矩阵规模变化)

GPU采用多线程架构的方法

理论上,当前处理器均采用多级流水线的方法,每条指令依次通过各阶段的处理(F、D、S、E、W)。然而在顺序处理器中,如果指令数据缓存未命中,那么后续指令必须等待。而实际上存在大量情况下后续指令并不依赖当前指令。此次引入两种处理策略

  • 在多线程方法中,处理器简单切换到另一个线程,不管前一条指令是否产生阻塞。GPU采用多线程技术,灵活切换线程执行指令
  • CPU采用乱序、缓存系统和指令级并行(ILP)来应对延迟
    [备注] 更长的内存延迟一般需要更懂数量的线程来隐藏

GPU的多线程前端拓展

GPU通过程序计数器(PC)值来标记每个线程束。除了PC,每个线程束一般还需要独立的寄存器。所以,GPU中的上下文切换意味着在多个PC寄存器和寄存器文件之间的指针切换,而CPU的上下文切换一般需要把调用线程的内容重新加载寄存器文件之中,继而产生显著的时间开销
[备注] 典型的,K个线程束,每个线程具有N个寄存器,那么总寄存器文件大小为 K × N K \times N K×N

相关推荐
科技小花24 分钟前
数据治理平台架构演进观察:AI原生设计如何重构企业数据管理范式
数据库·重构·架构·数据治理·ai-native·ai原生
2501_9481142426 分钟前
2026年大模型API聚合平台技术评测:企业级接入层的治理演进与星链4SAPI架构观察
大数据·人工智能·gpt·架构·claude
FserSuN41 分钟前
LangChain DeepAgent 多 Agent 架构原理学习
架构·langchain
坏孩子的诺亚方舟1 小时前
RTL设计师攻略0_架构与微架构
架构·cpu·面试攻略
智星云算力1 小时前
本地GPU与租用GPU混合部署:混合算力架构搭建指南
人工智能·架构·gpu算力·智星云·gpu租用
熊猫钓鱼>_>3 小时前
从“流程固化“到“意图驱动“:大模型调智能体调Skill架构深度解析
ai·架构·大模型·llm·agent·skill·openclaw
Agent产品评测局4 小时前
互联网行业自动化平台选型,运营全流程提效指南:2026企业级智能体架构与实战全解析
运维·人工智能·ai·chatgpt·架构·自动化
AI成长日志5 小时前
【AI原生开发实战】1.2 传统开发 vs AI原生开发:思维转变与架构差异
服务器·架构·ai-native
戮戮5 小时前
Spring Cloud Gateway 零拷贝参数校验:一种高性能网关架构实践
java·网络·架构·gateway
LONGZETECH5 小时前
汽车故障诊断仿真教学软件【哈弗M6PLUS】:技术架构、功能实现与落地实践
架构·汽车·职业教育·汽车仿真教学软件·汽车故障诊断