技术栈

ai推理工程师

fgh431
1 年前
ai·nvidia·cutlass·ai推理工程师
发表博客之:gemm/threadblock/threadblock_swizzle.h 文件夹讲解,cutlass深入讲解如果 N = 2 N=2 N=2,那么三对<<<>>>发射的grid就是(8,2,1)!那么每个Tile被映射到的ThreadBlock id如下图所示。