cuda核函数编程小结

文章目录

一、环境配置

几个注意事项先写在前面:

  1. 环境问题:一定要VS2019以上的!!!切记注意,目前VS2019以下已经不更新了,这里我就是用的2019,然后下面参考文档还是2015,反正过程没错,把VS版本改成2019即可;
  2. GPU及CUDA版本:我这边是NV RTX 3050Laptop 和 CUDA 11.8版本,建议CUDA版本别太低;
  3. 按照以下步骤在添加文件的时候没有NVIDIA的选项也没关系,创建后缀为".cu"的文件即可,其实是".c",核函数的格式是c语言的格式,而非C++,所以不能写在.cpp的文件中,不然会报错:error C2059: 语法错误:"<" 问题;

二、核函数代码书写格式

关于核函数的书写格式,看这篇比较易懂:https://www.cxyzjd.com/article/sinat_33718563/79156147

浅显的说,就是在cu文件中extern "C"声明C语言函数,然后在这个函数里面调用核函数,且核函数也放在cu文件中。第二步是在cpp文件中也用extern "C"声明cu中的C语言函数,然后用的时候直接用即可。

三、小结

cuda核函数编程环境配置和写法,其实不是很难,第一次接触可能觉得麻烦点,在核函数里面的多grid和多线程编程还是有点麻烦的,这个写的时候要特别注意,也可以啥都不用直接1,1在调用核函数的时候,然后可以参考下以下链接:

https://blog.csdn.net/zhanghaijun2013/article/details/107018029

https://blog.51cto.com/u_15316847/5949054

https://blog.csdn.net/weixin_41449637/article/details/120200121

https://cloud.tencent.com/developer/article/2065713

相关推荐
放羊郎5 天前
配置Nvidia JETSON AGX Xavier
nvidia·虚拟机·jetson·刷机·重装系统·xavier
笑脸惹桃花11 天前
50系显卡训练深度学习YOLO等算法报错的解决方法
深度学习·算法·yolo·torch·cuda
free-xx12 天前
AGX Orin平台RTC驱动导致reboot系统卡住问题调试
nvidia·jetson·orin
weiwei2284415 天前
NVIDIA Kernel级性能分析工具Nsight Compute入门详解
gpu·cuda·nsight compute
AndrewHZ19 天前
【三维渲染技术讨论】Blender输出的三维文件里的透明贴图在Isaac Sim里会丢失, 是什么原因?
算法·3d·blender·nvidia·贴图·具身智能·isaac sim
荔枝吻23 天前
【沉浸式解决问题】NVIDIA 显示设置不可用。 您当前未使用连接到NVIDIA GPU 的显示器。
nvidia·英伟达
算家计算23 天前
算力暴增!英伟达发布新一代机器人超级计算机,巨量算力驱动物理AI革命
人工智能·云计算·nvidia
山烛24 天前
深度学习:CUDA、PyTorch下载安装
人工智能·pytorch·python·深度学习·cuda
可期不折腾25 天前
NVIDIA Nsight Systems性能分析工具
ubuntu·nvidia·nsight systems·性能分析工具
伊织code25 天前
PyTorch API 2
pytorch·api·cpu·cuda·微分·autograd