CUDA执行模型

一、CUDA执行模型概述

二、线程束执行

1. 线程束与线程块

线程束是SM中基本的执行单元。

当一个线程块的网格被启动后,网格中的线程块分布在SM中。

一旦线程块被调度到一个SM中,线程块中的线程会被进一步划分成线程束。

一个线程束由32个连续的线程组成,在一个线程束中,所有的线程按照单指令多线程方式执行。

所有线程都执行相同的指令,每个线程在私有数据上进行操作。

从逻辑角度看,线程块是线程的集合,可以被组织成一维、二维或三维布局。

从硬件角度看,线程块是一维线程束的集合。在线程块中线程被组织成一维布局,每32个连续线程组织成一个线程束。

2. 线程束分化

GPU是相对简单的设备,没有复杂的分支预测机制。

一个线程束中的所有线程在同一周期中必须执行相同的指令,如果一个线程执行一条指令,那么线程束中的所有线程都必须执行该指令。

为了获得最佳的性能,应该避免在同一个线程束中有不同的执行路径,以确保同一个线程束中所有的线程在一个应用程序中使用同一个控制路径。

相关推荐
Hx_Ma161 分钟前
测试题(四)
java·开发语言·jvm
Never_Satisfied14 分钟前
在c#中,抛出异常,并指定其message的值
java·javascript·c#
多打代码17 分钟前
2026.02.11
开发语言·python
没有bug.的程序员18 分钟前
IDEA 效能巅峰实战:自定义模板 Live Templates 内核、快捷键精密逻辑与研发提效深度指南
java·ide·intellij-idea·快捷键·研发提效·自定义模板
lly20240619 分钟前
Scala IF...ELSE 语句详解
开发语言
追随者永远是胜利者24 分钟前
(LeetCode-Hot100)22. 括号生成
java·算法·leetcode·职场和发展·go
逝水如流年轻往返染尘26 分钟前
java中的泛型
java
百锦再29 分钟前
Java重入锁(ReentrantLock)全面解析:从入门到源码深度剖析
java·开发语言·struts·spring·kafka·tomcat·intellij-idea
知识即是力量ol29 分钟前
口语八股—— Spring 面试实战指南(终篇):常用注解篇、Spring中的设计模式
java·spring·设计模式·面试·八股·常用注解
Electron-er1 小时前
深入解析C语言memcmp函数:内存比较的利器与陷阱(附实战案例)
c语言·开发语言