CUDA原子操作

代码

c 复制代码
#include <cuda_runtime.h>
#include <stdio.h>

__global__ void atomicAddAndGet(int *result, int *valueToAdd) {
        // 原子加法
        int addedValue = atomicAdd(result, *valueToAdd);

        // 通过原子操作后读取值,确保是加法后的值
        addedValue += *valueToAdd;
        printf("Thread %d: Added value: %d\n", threadIdx.x, addedValue);
}

int main() {
        int result = 0;
        int valueToAdd = 5;
        int *d_result, *d_valueToAdd;

        // 在GPU上分配内存
        cudaMalloc((void**)&d_result, sizeof(int));
        cudaMalloc((void**)&d_valueToAdd, sizeof(int));

        // 将数据从主机内存复制到GPU内存
        cudaMemcpy(d_result, &result, sizeof(int), cudaMemcpyHostToDevice);
        cudaMemcpy(d_valueToAdd, &valueToAdd, sizeof(int), cudaMemcpyHostToDevice);

        // 启动CUDA核函数
        atomicAddAndGet << <1, 32 >> > (d_result, d_valueToAdd);

        // 将结果从GPU内存复制回主机内存
        cudaMemcpy(&result, d_result, sizeof(int), cudaMemcpyDeviceToHost);

        // 输出结果
        printf("Result after atomic addition: %d\n", result);

        // 释放GPU上的内存
        cudaFree(d_result);
        cudaFree(d_valueToAdd);

        return 0;
}

结果

相关推荐
亭上秋和景清10 分钟前
指针进阶:函数指针详解
开发语言·c++·算法
胡萝卜3.010 分钟前
C++现代模板编程核心技术精解:从类型分类、引用折叠、完美转发的内在原理,到可变模板参数的基本语法、包扩展机制及emplace接口的底层实现
开发语言·c++·人工智能·机器学习·完美转发·引用折叠·可变模板参数
9ilk12 分钟前
【C++】--- C++11
开发语言·c++·笔记·后端
FMRbpm31 分钟前
队列练习--------最近的请求次数(LeetCode 933)
数据结构·c++·leetcode·新手入门
biter down1 小时前
C++ 函数重载:从概念到编译原理
开发语言·c++
ZouZou老师2 小时前
C++设计模式之解释器模式:以家具生产为例
c++·设计模式·解释器模式
无限进步_2 小时前
深入理解 C/C++ 内存管理:从内存布局到动态分配
c语言·c++·windows·git·算法·github·visual studio
JANGHIGH2 小时前
c++ 多线程(三)
开发语言·c++
点云SLAM3 小时前
C++ 中traits 类模板(type traits / customization traits)设计技术深度详解
c++·算法·c++模板·c++高级应用·traits 类模板·c++17、20·c++元信息
水饺编程4 小时前
第3章,[标签 Win32] :处理 WM_PRINT 消息
c语言·c++·windows·visual studio