cuda核函数编程小结

文章目录

一、环境配置

几个注意事项先写在前面:

  1. 环境问题:一定要VS2019以上的!!!切记注意,目前VS2019以下已经不更新了,这里我就是用的2019,然后下面参考文档还是2015,反正过程没错,把VS版本改成2019即可;
  2. GPU及CUDA版本:我这边是NV RTX 3050Laptop 和 CUDA 11.8版本,建议CUDA版本别太低;
  3. 按照以下步骤在添加文件的时候没有NVIDIA的选项也没关系,创建后缀为".cu"的文件即可,其实是".c",核函数的格式是c语言的格式,而非C++,所以不能写在.cpp的文件中,不然会报错:error C2059: 语法错误:"<" 问题;

二、核函数代码书写格式

关于核函数的书写格式,看这篇比较易懂:https://www.cxyzjd.com/article/sinat_33718563/79156147

浅显的说,就是在cu文件中extern "C"声明C语言函数,然后在这个函数里面调用核函数,且核函数也放在cu文件中。第二步是在cpp文件中也用extern "C"声明cu中的C语言函数,然后用的时候直接用即可。

三、小结

cuda核函数编程环境配置和写法,其实不是很难,第一次接触可能觉得麻烦点,在核函数里面的多grid和多线程编程还是有点麻烦的,这个写的时候要特别注意,也可以啥都不用直接1,1在调用核函数的时候,然后可以参考下以下链接:

https://blog.csdn.net/zhanghaijun2013/article/details/107018029

https://blog.51cto.com/u_15316847/5949054

https://blog.csdn.net/weixin_41449637/article/details/120200121

https://cloud.tencent.com/developer/article/2065713

相关推荐
fleaxin12 小时前
统信服务器操作系统V20(1070)安装过程
docker·操作系统·nvidia·统信
人工智能训练4 天前
【极速部署】Ubuntu24.04+CUDA13.0 玩转 VLLM 0.15.0:预编译 Wheel 包 GPU 版安装全攻略
运维·前端·人工智能·python·ai编程·cuda·vllm
X-Vision4 天前
Visual Studio 2022中配置cuda环境
visual studio·cuda
安全二次方security²4 天前
CUDA C++编程指南(7.31&32&33&34)——C++语言扩展之性能分析计数器函数和断言、陷阱、断点函数
c++·人工智能·nvidia·cuda·断点·断言·性能分析计数器函数
安全二次方security²6 天前
CUDA C++编程指南(7.25)——C++语言扩展之DPX
c++·人工智能·nvidia·cuda·dpx·cuda c++编程指南
不教书的塞涅卡7 天前
SSH远程接入PyTorch-CUDA-v2.9镜像,随时随地训练大模型
pytorch·ssh·cuda
安全二次方security²10 天前
CUDA C++编程指南(7.19&20)——C++语言扩展之Warp投票函数和Warp匹配函数
c++·人工智能·nvidia·cuda·投票函数·匹配函数·vote
安全二次方security²11 天前
CUDA C++编程指南(7.15&16)——C++语言扩展之内存空间谓词和转化函数
c++·人工智能·nvidia·cuda·内存空间谓词函数·内存空间转化函数·address space
安全二次方security²11 天前
CUDA C++编程指南(7.5&6)——C++语言扩展之内存栅栏函数和同步函数
c++·人工智能·nvidia·cuda·内存栅栏函数·同步函数·syncthreads
安全二次方security²12 天前
CUDA C++编程指南(7.2)——C++语言扩展之变量内存空间指定符
c++·人工智能·nvidia·cuda·内存空间指定符·__shared__·__device__