RuntimeError: CUDA error: __global__ function call is not configured

表明在 CUDA 设备上调用的核函数 没有正确配置线程块和网格维度

一般体现在:

直接调用 kernel 函数,而不是通过 launch 函数 指定 kernel 函数调用

解决方法(示例):

cpp 复制代码
// kernel function
__global__ void Idtest_kernel(float *a, int N) {
    int idx = blockIdx.x * blockDim.x + threadIdx.x;
    if(idx < N){
      a[idx] = idx;
    }
}

// launch kernel function
void launch_Idtest_kernel(torch::Tensor a) {
  int N = a.numel();
  int block_size = 256;
  int grid_size = (N + block_size - 1) / block_size;
  Idtest_kernel<<<grid_size, block_size>>>(
    reinterpret_cast<float *>(a.data_ptr()),
    N);
}
相关推荐
【建模先锋】3 分钟前
一区直接写!CEEMDAN分解 + Informer-LSTM +XGBoost组合预测模型
人工智能·lstm·ceemdan·预测模型·风速预测·时间序列预测模型
fsnine7 分钟前
YOLOv2原理介绍
人工智能·计算机视觉·目标跟踪
倔强的石头10636 分钟前
AI修图革命:IOPaint+cpolar让废片拯救触手可及
人工智能·cpolar·iopaint
文火冰糖的硅基工坊40 分钟前
[人工智能-大模型-15]:大模型典型产品对比 - 数字人
人工智能·大模型·大语言模型
JJJJ_iii43 分钟前
【机器学习05】神经网络、模型表示、前向传播、TensorFlow实现
人工智能·pytorch·python·深度学习·神经网络·机器学习·tensorflow
William.csj1 小时前
服务器/Pytorch——对于只调用一次的函数初始化,放在for训练外面和里面的差异
人工智能·pytorch·python
魔术师卡颂1 小时前
不就写提示词?提示词工程为啥是工程?
前端·人工智能·后端
Ingsuifon1 小时前
pytorch踩坑记录
人工智能·pytorch·python
聚梦小课堂1 小时前
3D生成软件Rodin 2.0 简单测试案例
人工智能·图形图像·3d生成·rodin·产品体验
CLubiy1 小时前
【研究生随笔】PyTorch中的概率论
人工智能·pytorch·深度学习·概率论