CUDA补充笔记

文章目录

一、不同核函数前缀

二、指定kernel要执行的线程数量

总共需要线程数是:

复制代码
1 * N = N个线程

三、线程需要两个内置坐标变量来唯一标识线程

①都是dim3类型变量

blockIdx指明线程在grid中的位置,threadIdx指明线程所在block中的位置

  • 若使用的向量大小为1<<20,假设block大小为256,而grid的大小就是4096

③而线程的ID值为:

二维:对于2-dim的block(Dx,Dy),线程(x,y)的ID值为(x+ yDx)
三维:如果是3-dim的block(Dx,Dy,Dz),线程(x,y,z)的ID值为(x+ y
Dx +zDxDy)

④矩阵加法

四、不是blocksize越大越好,上限一般是1024个blocksize

相关推荐
听麟30 分钟前
HarmonyOS 6.0+ 跨端智慧政务服务平台开发实战:多端协同办理与电子证照管理落地
笔记·华为·wpf·音视频·harmonyos·政务
risc1234561 小时前
认识一个事物,需要哪些基本能力与要素?
笔记
firewood20242 小时前
共射三极管放大电路相关情况分析
笔记·学习
Hello_Embed2 小时前
libmodbus STM32 主机实验(USB 串口版)
笔记·stm32·学习·嵌入式·freertos·modbus
risc1234562 小时前
思维脚手架
笔记
risc1234562 小时前
只身走过多少的岁月,弹指一梦不过一瞬间
笔记
小陈phd3 小时前
多模态大模型学习笔记(一)——机器学习入门:监督/无监督学习核心任务全解析
笔记·学习·机器学习
崎岖Qiu3 小时前
【计算机网络 | 第九篇】PPP:点对点协议
网络·笔记·计算机网络·ppp
听麟3 小时前
HarmonyOS 6.0+ PC端虚拟仿真训练系统开发实战:3D引擎集成与交互联动落地
笔记·深度学习·3d·华为·交互·harmonyos
一个人旅程~4 小时前
我存在吗?你存在吗?
笔记·程序人生·电脑·ai写作