CUDA C++编程指南(7.1)——C++语言扩展之函数执行空间指定符

函数执行空间限定符用于指定函数是在主机上执行还是在设备上执行,以及是否可以从主机或设备调用。

7.1.1. global

__global__执行空间说明符将函数声明为内核。此类函数具有以下特性:

  • 在设备上执行,

  • 可从主机调用,

  • 对于计算能力5.0或更高的设备可从设备端调用。

一个 __global__ 函数必须具有 void 返回类型,并且不能是类的成员。

任何对__global__函数的调用都必须按照执行配置中所述指定其执行配置。

调用__global__函数是异步的,这意味着它在设备完成执行之前就会返回。

7.1.2. device

__device__执行空间说明符用于声明一个函数,该函数具有以下特性:

  • 在设备上执行,

  • 仅可从设备端调用。

__global____device__ 执行空间说明符不能同时使用。

7.1.3. host

__host__执行空间说明符声明了一个函数,该函数是:

  • 在主机上执行,

  • 仅可从主机端调用。

这相当于声明一个仅带有__host__执行空间说明符的函数,或者声明一个不包含任何__host____device____global__执行空间说明符的函数;无论哪种情况,该函数都仅为主机编译。

__global____host__ 执行空间说明符不能同时使用。

__device____host__ 执行空间说明符可以同时使用,在这种情况下,函数会同时为主机和设备编译。 应用兼容性中介绍的 __CUDA_ARCH__ 宏可用于区分主机和设备之间的代码路径:

复制代码
__host__ __device__ func()
{
#if __CUDA_ARCH__ >= 800
   // Device code path for compute capability 8.x
#elif __CUDA_ARCH__ >= 700
   // Device code path for compute capability 7.x
#elif __CUDA_ARCH__ >= 600
   // Device code path for compute capability 6.x
#elif __CUDA_ARCH__ >= 500
   // Device code path for compute capability 5.x
#elif !defined(__CUDA_ARCH__)
   // Host code path
#endif
}

7.1.4. 未定义行为

当出现以下情况时,"跨执行空间"调用具有未定义行为:

  • __CUDA_ARCH__ 已定义的情况下,从 __global____device____host__ __device__ 函数内部调用 __host__ 函数。

  • __CUDA_ARCH__ 未定义,从 __host__ 函数内部调用 __device__ 函数的情况。

7.1.5. noinlineforceinline

编译器会在认为适当时内联任何__device__函数。

__noinline__ 函数限定符可用作提示编译器尽可能不要内联该函数。

__forceinline__ 函数限定符可用于强制编译器内联该函数。

__noinline____forceinline__ 函数限定符不能同时使用,且这两个限定符都不能应用于内联函数。

7.1.6. inline_hint

__inline_hint__限定符使编译器能够进行更激进的函数内联优化。与__forceinline__不同,它并不强制要求函数必须内联。在使用LTO(链接时优化)时,该限定符可用于提升跨模块的内联优化效果。

__noinline____forceinline__ 函数限定符都不能与 __inline_hint__ 函数限定符一起使用。

相关推荐
编程小白20262 分钟前
从 C++ 基础到效率翻倍:Qt 开发环境搭建与Windows 神级快捷键指南
开发语言·c++·windows·qt·学习
大闲在人3 分钟前
10. 配送中心卡车卸货流程分析:产能利用率与利特尔法则的实践应用
人工智能·供应链管理·智能制造·工业工程
woshikejiaih3 分钟前
**播客听书与有声书区别解析2026指南,适配不同场景的音频
大数据·人工智能·python·音视频
qq7422349846 分钟前
APS系统与OR-Tools完全指南:智能排产与优化算法实战解析
人工智能·算法·工业·aps·排程
兜兜转转了多少年7 分钟前
从脚本到系统:2026 年 AI 代理驱动的 Shell 自动化
运维·人工智能·自动化
LLWZAI11 分钟前
十分钟解决朱雀ai检测,AI率为0%
人工智能
无忧智库11 分钟前
某市“十五五“智慧气象防灾减灾精准预报系统建设方案深度解读 | 从“看天吃饭“到“知天而作“的数字化转型之路(WORD)
大数据·人工智能
方见华Richard11 分钟前
方见华个人履历|中英双语版
人工智能·经验分享·交互·原型模式·空间计算
凤希AI伴侣12 分钟前
凤希AI伴侣:一人成军的工具哲学与全模态内容实践-2026年2月7日
人工智能·凤希ai伴侣
Sagittarius_A*13 分钟前
特征检测:SIFT 与 SURF(尺度不变 / 加速稳健特征)【计算机视觉】
图像处理·人工智能·python·opencv·计算机视觉·surf·sift