技术栈
ai推理工程师
fgh431
6 个月前
ai
·
nvidia
·
cutlass
·
ai推理工程师
发表博客之:gemm/threadblock/threadblock_swizzle.h 文件夹讲解,cutlass深入讲解
如果 N = 2 N=2 N=2,那么三对<<<>>>发射的grid就是(8,2,1)!那么每个Tile被映射到的ThreadBlock id如下图所示。