CUDA补充笔记

文章目录

一、不同核函数前缀

二、指定kernel要执行的线程数量

总共需要线程数是:

复制代码
1 * N = N个线程

三、线程需要两个内置坐标变量来唯一标识线程

①都是dim3类型变量

blockIdx指明线程在grid中的位置,threadIdx指明线程所在block中的位置

  • 若使用的向量大小为1<<20,假设block大小为256,而grid的大小就是4096

③而线程的ID值为:

二维:对于2-dim的block(Dx,Dy),线程(x,y)的ID值为(x+ yDx)
三维:如果是3-dim的block(Dx,Dy,Dz),线程(x,y,z)的ID值为(x+ y
Dx +zDxDy)

④矩阵加法

四、不是blocksize越大越好,上限一般是1024个blocksize

相关推荐
lingggggaaaa37 分钟前
小迪安全v2023学习笔记(六十一讲)—— 持续更新中
笔记·学习·安全·web安全·网络安全·反序列化
不太可爱的叶某人1 小时前
【学习笔记】Java并发编程的艺术——第6章 Java并发容器和框架
java·笔记·学习
超勇的阿杰3 小时前
gulimall项目笔记:P54三级分类拖拽功能实现
android·笔记
饕餮争锋3 小时前
设计模式笔记_行为型_策略模式
笔记·设计模式·策略模式
₯㎕星空&繁华5 小时前
Linux-地址空间
linux·运维·服务器·经验分享·笔记
诗书画唱5 小时前
学习笔记与效率提升指南:编程、记忆与面试备考
笔记·学习·面试
似乎很简单6 小时前
【opencv-Python学习笔记(5):几何变换】
笔记·opencv·学习
teeeeeeemo8 小时前
跨域及解决方案
开发语言·前端·javascript·笔记
丁满与彭彭9 小时前
嵌入式学习笔记--MCU阶段--DAY12实时操作系统rt_thread1
笔记·学习
范纹杉想快点毕业10 小时前
嵌入式 C 语言编程规范个人学习笔记,参考华为《C 语言编程规范》
linux·服务器·数据库·笔记·单片机·嵌入式硬件·fpga开发