技术栈
cutlass sgemm
fgh431
7 个月前
线性代数
·
矩阵
·
cutlass sgemm
发表博客之:cutlass demo讲解,在 sm75 机器上用 cuda core计算 fp32 矩阵乘法!对cutlass 感兴趣的看客别走开!!
nvcc A.cu -o a.out -arch sm_75 -lcublas -I /root/cutlass/include/ -std=c++17 /root/cutlass是cutlass仓库的路径,如果cutlass仓库在别的目录下,请小可爱你自己修改!