CUDA Bug<三>当__global__函数出现里面所有输出的数组都随机赋值了

问题具体描述:

eg.

cpp 复制代码
__global__ void Updata_HomJm(float* H,float *HJm,float* fr,float *gr,float* ur,float* urgrJm,float*wpd,float *w, float *wJm,int n)
{  

	int idx = blockIdx.x*blockDim.x + threadIdx.x;
	float t = 0.0;//H*zp
	int idx_Ai = idx*n;



	for (int j=0; j<n; j++)
	{
		t += H[idx_Ai + j] * fr[j];//0	
		if((j==idx)||(abs(wpd[idx])==2&&abs(wpd[j])==2))
		{
			HJm[idx_Ai + j]=H[idx_Ai + j];
		}
		else
		{
			HJm[idx_Ai + j]=0;
		}
	}
	gr[idx]=t;
	if (abs(wpd[idx])==2)
	{
		wJm[idx]=w[idx];
		urgrJm[idx]=-(ur[idx]+gr[idx]);
	}else
	{
		wJm[idx]=0.0;
		urgrJm[idx]=0.0;
	}


}

这里gr,wJm,urgrJm都是计算后需要输出的值,这三个数组同时乱码,

第一个想法即使:代码有误

采取排除的方式,先将if判断都注释掉,发现还是有错;

再将wJm和urgrJm有关的都注释,发现gr计算结果正常,那么大概率不是__global__函数错误,将错误锁定在这两个数组身上,猜测可能是gr,wJm,urgrJm这三个数组size不同,则检查主函数,发现是wJm忘开辟空间。

解决办法

在主函数加入

cpp 复制代码
	cudaMalloc((void**)&d_wJm, sizeof(float)*WS*1);
相关推荐
lightqjx13 小时前
【C++】C++11 - Lambda表达式+包装器
开发语言·c++·c++11·lambda·包装器
载数而行52013 小时前
算法系列1之最小生成树
c语言·数据结构·c++·算法·贪心算法
额,不知道写啥。13 小时前
HAO的DP
c++·算法·深度优先·动态规划
重生之后端学习13 小时前
208. 实现 Trie (前缀树)
java·开发语言·数据结构·算法·职场和发展·深度优先
niuniudengdeng13 小时前
一种基于XRF实景建模与AI世界生成的一步闭式解光线追踪视觉生成模型
人工智能·数学·算法
mit6.82413 小时前
树上滑窗
算法
我命由我1234513 小时前
C++ EasyX 开发,MessageBox 函数参数问题:“const char *“ 类型的实参与 “LPCWSTR“ 类型的形参不兼容
c语言·开发语言·c++·后端·学习·visualstudio·visual studio
Trouvaille ~13 小时前
【Linux】高并发服务器的起点:五种 IO 模型与非阻塞 IO 本质解析
linux·运维·服务器·c++·操作系统·io模型·同步异步
ADDDDDD_Trouvaille13 小时前
2026.2.19——OJ89-91题
c++·算法
Trouvaille ~13 小时前
【Linux】select 多路转接深度剖析:从位图原理到字典服务器实现
linux·运维·服务器·c++·select·多路转接·io模型