CUDA补充笔记

文章目录

一、不同核函数前缀

二、指定kernel要执行的线程数量

总共需要线程数是:

复制代码
1 * N = N个线程

三、线程需要两个内置坐标变量来唯一标识线程

①都是dim3类型变量

blockIdx指明线程在grid中的位置,threadIdx指明线程所在block中的位置

  • 若使用的向量大小为1<<20,假设block大小为256,而grid的大小就是4096

③而线程的ID值为:

二维:对于2-dim的block(Dx,Dy),线程(x,y)的ID值为(x+ yDx)
三维:如果是3-dim的block(Dx,Dy,Dz),线程(x,y,z)的ID值为(x+ y
Dx +zDxDy)

④矩阵加法

四、不是blocksize越大越好,上限一般是1024个blocksize

相关推荐
一只侯子8 小时前
Face AE Tuning
图像处理·笔记·学习·算法·计算机视觉
whale fall11 小时前
【剑雅14】笔记
笔记
星空的资源小屋12 小时前
跨平台下载神器ArrowDL,一网打尽所有资源
javascript·笔记·django
Xudde.12 小时前
Quick2靶机渗透
笔记·学习·安全·web安全·php
AA陈超13 小时前
Git常用命令大全及使用指南
笔记·git·学习
愚戏师14 小时前
Python3 Socket 网络编程复习笔记
网络·笔记
降临-max14 小时前
JavaSE---网络编程
java·开发语言·网络·笔记·学习
大白的编程日记.15 小时前
【计算网络学习笔记】MySql的多版本控制MVCC和Read View
网络·笔记·学习·mysql
IMPYLH16 小时前
Lua 的 require 函数
java·开发语言·笔记·后端·junit·lua
YJlio19 小时前
进程和诊断工具学习笔记(8.29):ListDLLs——一眼看清进程里加载了哪些 DLL,谁在偷偷注入
android·笔记·学习