cuda核函数编程小结

文章目录

一、环境配置

几个注意事项先写在前面:

  1. 环境问题:一定要VS2019以上的!!!切记注意,目前VS2019以下已经不更新了,这里我就是用的2019,然后下面参考文档还是2015,反正过程没错,把VS版本改成2019即可;
  2. GPU及CUDA版本:我这边是NV RTX 3050Laptop 和 CUDA 11.8版本,建议CUDA版本别太低;
  3. 按照以下步骤在添加文件的时候没有NVIDIA的选项也没关系,创建后缀为".cu"的文件即可,其实是".c",核函数的格式是c语言的格式,而非C++,所以不能写在.cpp的文件中,不然会报错:error C2059: 语法错误:"<" 问题;

二、核函数代码书写格式

关于核函数的书写格式,看这篇比较易懂:https://www.cxyzjd.com/article/sinat_33718563/79156147

浅显的说,就是在cu文件中extern "C"声明C语言函数,然后在这个函数里面调用核函数,且核函数也放在cu文件中。第二步是在cpp文件中也用extern "C"声明cu中的C语言函数,然后用的时候直接用即可。

三、小结

cuda核函数编程环境配置和写法,其实不是很难,第一次接触可能觉得麻烦点,在核函数里面的多grid和多线程编程还是有点麻烦的,这个写的时候要特别注意,也可以啥都不用直接1,1在调用核函数的时候,然后可以参考下以下链接:

https://blog.csdn.net/zhanghaijun2013/article/details/107018029

https://blog.51cto.com/u_15316847/5949054

https://blog.csdn.net/weixin_41449637/article/details/120200121

https://cloud.tencent.com/developer/article/2065713

相关推荐
王小义笔记2 天前
CUDA 版本下 Transformers 报错排查与解决办法
llm·transformer·cuda
努力的章鱼bro3 天前
CUDA编程模型
c++·cuda
OpenCSG4 天前
Cosmos3:NVIDIA 把世界模型做成了“理解、生成、模拟、行动”的统一入口
人工智能·大模型·nvidia·opencsg
OpenBayes贝式计算6 天前
端侧同尺寸 SOTA:OpenBMB 发布 1B 参数模型 MiniCPM5-1B;集成多级平行语料与多语言词典:SMOL 翻译数据集开源
计算机视觉·google·nvidia
OpenBayes贝式计算6 天前
教程上新丨英伟达开源 LocateAnything,3B 模型可实现图像 + 视频的目标指向 / 开放词汇目标检测/指代表达定位 / OCR 文本定位等功能
计算机视觉·agent·nvidia
努力的章鱼bro6 天前
CUDA编程入门
c++·人工智能·cuda
视***间7 天前
算力筑基,智领人形机器人新时代 —— 英伟达 × 宇树科技携手推进具身智能,视程空间基于 NVIDIA 全栈算力产品助力机器人产业落地
人工智能·机器人·nvidia·机器狗·gpt-oss·视程空间·宇树机器人
wangruofeng8 天前
NVIDIA RTX Spark 背后,联发科也坐上了主桌
aigc·nvidia
AI科技大本营9 天前
MediaTek 与NVIDIA 合作推出 NVIDIA RTX Spark,驱动下一代 Windows PC 体验
nvidia·mediatek
阿里云大数据AI技术10 天前
基于阿里云 DataWorks Data Agent 进行大模型热度分析
人工智能·agent·nvidia