RuntimeError: CUDA error: __global__ function call is not configured

表明在 CUDA 设备上调用的核函数 没有正确配置线程块和网格维度

一般体现在:

直接调用 kernel 函数,而不是通过 launch 函数 指定 kernel 函数调用

解决方法(示例):

cpp 复制代码
// kernel function
__global__ void Idtest_kernel(float *a, int N) {
    int idx = blockIdx.x * blockDim.x + threadIdx.x;
    if(idx < N){
      a[idx] = idx;
    }
}

// launch kernel function
void launch_Idtest_kernel(torch::Tensor a) {
  int N = a.numel();
  int block_size = 256;
  int grid_size = (N + block_size - 1) / block_size;
  Idtest_kernel<<<grid_size, block_size>>>(
    reinterpret_cast<float *>(a.data_ptr()),
    N);
}
相关推荐
云飞云共享云桌面3 分钟前
佛山某机械加工设备工厂10个SolidWorks共享一台服务器的软硬件
大数据·运维·服务器·前端·网络·人工智能·性能优化
一水鉴天7 分钟前
整体设计 定稿 之17 从三种“闭”概念到 色调/文字/字体 中 三种字体(宋体/斜体/粗体)
人工智能
小陈phd7 分钟前
RAG从入门到精通(十四)——评估技术
人工智能·python
jerryinwuhan13 分钟前
稿件整理以及意见
人工智能
懂AI的老郑15 分钟前
基于多源信息融合的杂草生长中心识别与判定技术研究
人工智能
有Li17 分钟前
基于几何深度学习的无监督多模态表面配准|文献速递-文献分享
人工智能·深度学习·文献
OpenCSG17 分钟前
无需人类干预,300 轮自主思考!Kimi K2 Thinking 模型发布,多项基准达 SOTA
人工智能·开源·kimi·csghub
音视频牛哥23 分钟前
从低延迟到高可用:RTMP与 HTTP/HTTPS-FLV在App播放体系中的角色重构
人工智能·音视频·音视频开发·http-flv播放器·https-flv播放器·ws-flv播放器·wss-flv播放器
fantasy_arch27 分钟前
RNN和残差网络模型的差异
网络·人工智能·rnn
极客BIM工作室29 分钟前
Google第六代Trillium TPU详解
人工智能