thread block grid模型

  1. 一维网格结构-->一条直线(1D 线): 整体只有一个x方向, 只能向一个方向走, 如果把thread当成点, block当成线, 那么grid是首位相连的block, 也就是整体是一条直线 ;
  • 全局线程 ID
java 复制代码
/*
想在直线上拿到全局id, 要逐步缩小范围, 首要要知道在这个线上的哪个部分, 也就是哪个block(blockIdx.x),
然后要知道前面的若干block总共包含多杀线程, 那就是要知道一个block包含多少线程(blockDim.x), 两者之积( blockDim.x * blockIdx.x)
也就拿到了block层面的id, 下一步深入到block内部, 要知道我在此block的id(threadIdx.x), 两者加起来就是全局id
*/
tid=threadIdx.x + blockDim.x * blockIdx.x
  1. 二维网格结构-->一个平面(2D 矩形): 整体有x,y两个方向, 如果把每个 thread 当作一个点,点有x和y两个走向, 那么一个 block 就是平面上的一块小矩形(由 threadIdx.x 和 threadIdx.y 张成的点阵)。若干个 block 在 x 和 y 方向上平铺排列,组成整个 grid(一个大的矩形平面)。
  • 全局线程 ID(一维线性化,行优先):
java 复制代码
/*
首先, 二维网格整体是个大矩阵, 所以要规定方向, 是行优先还是列优先, 此处为行优先
整个大矩阵是有若干个x向和y向的小矩阵组成的, 所以当我们要知道某个线程的具体id, 要先知道, 我这个线程所在
块的行
blockDim.x *blockDim.y 
*/
tid = 全局的 x 坐标 + 全局的 y 坐标 * 整个网格的宽度
      threadIdx.x + blockDim.x * blockIdx.x  //全局的 x 坐标(列号)
      + (threadIdx.y + blockDim.y * blockIdx.y) * (blockDim.x * gridDim.x)
     // +  全局的 y 坐标(行号)* 整个网格的 宽度(x 方向总线程数)
      
tid = block起始偏移 + 局部偏移
    = (blockIdx.y * gridDim.x + blockIdx.x) * (blockDim.x * blockDim.y) //blockId*block内线程数
      + (threadIdx.y * blockDim.x + threadIdx.x) // 块内的id
      
或者更清晰地写成:

x = blockIdx.x * blockDim.x + threadIdx.x
y = blockIdx.y * blockDim.y + threadIdx.y
tid = x 
      + y * (blockDim.x * gridDim.x)
- 其中 blockDim.x * gridDim.x 是整个平面的宽度(x 方向总点数)。
  1. 三维网格结构-->一个立体(3D 长方体):
  • 整体有 x, y, z 三个方向。
  • 一个 block 是一个小长方体(由 threadIdx.x, threadIdx.y, threadIdx.z 确定的点阵)。
  • 若干个 block 在 x, y, z 方向上立体排列,组成整个 grid(一个大的长方体)。
  • 全局线程 ID(一维线性化,按 x→y→z 顺序):
java 复制代码
x = blockIdx.x * blockDim.x + threadIdx.x
y = blockIdx.y * blockDim.y + threadIdx.y
z = blockIdx.z * blockDim.z + threadIdx.z
tid = x 
      + y * (blockDim.x * gridDim.x)
      + z * (blockDim.x * gridDim.x) * (blockDim.y * gridDim.y)
- 其中:
  - width = blockDim.x * gridDim.x (x 方向总点数)
  - height = blockDim.y * gridDim.y (y 方向总点数)
  - depth = blockDim.z * gridDim.z (z 方向总点数,通常用于体素或3D卷积)
相关推荐
BothSavage9 小时前
Trae远程开发中DeepSeek自定义模型4054错误的排查与修复
算法
小林ixn9 小时前
从暴力到KMP:一道题彻底搞懂字符串匹配的前世今生
算法
烬羽11 小时前
字符串算法入门:从反转字符串到回文判断,面试不再慌
算法·面试
先吃饱再说1 天前
判断回文字符串,从一行代码到双指针优化
算法
黄敬峰1 天前
深入理解算法核心:从递归思想、数组扁平化到快速排序
算法
得物技术1 天前
从狂野代码到按目标生产:得物推荐 AI Harness 的工程化实践|AICon 演讲整理
人工智能·算法·架构
AI小老六1 天前
SkillOpt 架构拆解:把 Skill 文本当参数,用执行轨迹训练 Agent
后端·算法·ai编程
胡萝卜术1 天前
从“分数打架”到“排名投票”:为什么你的ChatBI必须用RRF?
算法·设计模式·面试