CUDA执行模型

一、CUDA执行模型概述

二、线程束执行

1. 线程束与线程块

线程束是SM中基本的执行单元。

当一个线程块的网格被启动后,网格中的线程块分布在SM中。

一旦线程块被调度到一个SM中,线程块中的线程会被进一步划分成线程束。

一个线程束由32个连续的线程组成,在一个线程束中,所有的线程按照单指令多线程方式执行。

所有线程都执行相同的指令,每个线程在私有数据上进行操作。

从逻辑角度看,线程块是线程的集合,可以被组织成一维、二维或三维布局。

从硬件角度看,线程块是一维线程束的集合。在线程块中线程被组织成一维布局,每32个连续线程组织成一个线程束。

2. 线程束分化

GPU是相对简单的设备,没有复杂的分支预测机制。

一个线程束中的所有线程在同一周期中必须执行相同的指令,如果一个线程执行一条指令,那么线程束中的所有线程都必须执行该指令。

为了获得最佳的性能,应该避免在同一个线程束中有不同的执行路径,以确保同一个线程束中所有的线程在一个应用程序中使用同一个控制路径。

相关推荐
一抓掉一大把9 分钟前
MiniExcel模板填充Excel导出
开发语言·javascript·ecmascript
小红帽2.017 分钟前
开源PHP在线客服系统源码搭建教程
开发语言·开源·php
小刘不想改BUG39 分钟前
LeetCode 70 爬楼梯(Java)
java·算法·leetcode
qq_4335545442 分钟前
C++ list代码练习、set基础概念、set对象创建、set大小操作
开发语言·c++·list
张伯毅1 小时前
Java 类型参数 T、R 、 O 、K、V 、E 、? 区别
java·开发语言
lifallen1 小时前
Flink checkpoint
java·大数据·算法·flink
AI+程序员在路上1 小时前
单元测试与QTestLib框架使用
开发语言·c++·单元测试
爱尚你19931 小时前
Java并发编程:读写锁与普通互斥锁的深度对比
java·lock·readwritelock
比特森林探险记1 小时前
Go 中 map 的双值检测写法详解
java·前端·golang
IT_Octopus1 小时前
多线程下使用缓存+锁Lock, 出现“锁失效” + “缓存未命中竞争”的缓存击穿情况,双重检查缓存解决问题
java·spring·缓存