CUDA执行模型

一、CUDA执行模型概述

二、线程束执行

1. 线程束与线程块

线程束是SM中基本的执行单元。

当一个线程块的网格被启动后,网格中的线程块分布在SM中。

一旦线程块被调度到一个SM中,线程块中的线程会被进一步划分成线程束。

一个线程束由32个连续的线程组成,在一个线程束中,所有的线程按照单指令多线程方式执行。

所有线程都执行相同的指令,每个线程在私有数据上进行操作。

从逻辑角度看,线程块是线程的集合,可以被组织成一维、二维或三维布局。

从硬件角度看,线程块是一维线程束的集合。在线程块中线程被组织成一维布局,每32个连续线程组织成一个线程束。

2. 线程束分化

GPU是相对简单的设备,没有复杂的分支预测机制。

一个线程束中的所有线程在同一周期中必须执行相同的指令,如果一个线程执行一条指令,那么线程束中的所有线程都必须执行该指令。

为了获得最佳的性能,应该避免在同一个线程束中有不同的执行路径,以确保同一个线程束中所有的线程在一个应用程序中使用同一个控制路径。

相关推荐
仟濹14 小时前
【Java加强】1 异常 | 打卡day1
java·开发语言·python
去往火星14 小时前
Qt6 CMake 中引入 Qt Linguist 翻译功能
开发语言·qt
阿猿收手吧!14 小时前
【C++】atmoic原子操作与并发安全全解析
开发语言·c++·安全
AllData公司负责人14 小时前
【亲测好用】实时开发平台能力演示
java·c语言·数据库
pcm12356714 小时前
设计C/S架构的IM通信软件(3)
java·c语言·架构
zz345729811314 小时前
C语言基础概念7
c语言·开发语言
会开花的二叉树14 小时前
Reactor网络库的连接管理核心:Connection类
开发语言·网络·php
凯子坚持 c14 小时前
C++基于微服务脚手架的视频点播系统---客户端(1)
开发语言·c++·微服务
袖清暮雨14 小时前
Python爬虫(Scrapy框架)
开发语言·爬虫·python·scrapy
2401_8384725114 小时前
C++中的装饰器模式实战
开发语言·c++·算法