CUDA原子操作

代码

c 复制代码
#include <cuda_runtime.h>
#include <stdio.h>

__global__ void atomicAddAndGet(int *result, int *valueToAdd) {
        // 原子加法
        int addedValue = atomicAdd(result, *valueToAdd);

        // 通过原子操作后读取值,确保是加法后的值
        addedValue += *valueToAdd;
        printf("Thread %d: Added value: %d\n", threadIdx.x, addedValue);
}

int main() {
        int result = 0;
        int valueToAdd = 5;
        int *d_result, *d_valueToAdd;

        // 在GPU上分配内存
        cudaMalloc((void**)&d_result, sizeof(int));
        cudaMalloc((void**)&d_valueToAdd, sizeof(int));

        // 将数据从主机内存复制到GPU内存
        cudaMemcpy(d_result, &result, sizeof(int), cudaMemcpyHostToDevice);
        cudaMemcpy(d_valueToAdd, &valueToAdd, sizeof(int), cudaMemcpyHostToDevice);

        // 启动CUDA核函数
        atomicAddAndGet << <1, 32 >> > (d_result, d_valueToAdd);

        // 将结果从GPU内存复制回主机内存
        cudaMemcpy(&result, d_result, sizeof(int), cudaMemcpyDeviceToHost);

        // 输出结果
        printf("Result after atomic addition: %d\n", result);

        // 释放GPU上的内存
        cudaFree(d_result);
        cudaFree(d_valueToAdd);

        return 0;
}

结果

相关推荐
wregjru12 分钟前
【QT】4.QWidget控件(2)
c++
浅念-16 分钟前
C++入门(2)
开发语言·c++·经验分享·笔记·学习
小羊不会打字24 分钟前
CANN 生态中的跨框架兼容桥梁:`onnx-adapter` 项目实现无缝模型迁移
c++·深度学习
Max_uuc33 分钟前
【C++ 硬核】打破嵌入式 STL 禁忌:利用 std::pmr 在“栈”上运行 std::vector
开发语言·jvm·c++
近津薪荼35 分钟前
dfs专题4——二叉树的深搜(验证二叉搜索树)
c++·学习·算法·深度优先
艾莉丝努力练剑1 小时前
【Linux:文件】Ext系列文件系统(初阶)
大数据·linux·运维·服务器·c++·人工智能·算法
Once_day2 小时前
C++之《程序员自我修养》读书总结(1)
c语言·开发语言·c++·程序员自我修养
Trouvaille ~2 小时前
【Linux】TCP Socket编程实战(一):API详解与单连接Echo Server
linux·运维·服务器·网络·c++·tcp/ip·socket
坚果派·白晓明2 小时前
在鸿蒙设备上快速验证由lycium工具快速交叉编译的C/C++三方库
c语言·c++·harmonyos·鸿蒙·编程语言·openharmony·三方库
小镇敲码人2 小时前
深入剖析华为CANN框架下的Ops-CV仓库:从入门到实战指南
c++·python·华为·cann