CUDA原子操作

代码

c 复制代码
#include <cuda_runtime.h>
#include <stdio.h>

__global__ void atomicAddAndGet(int *result, int *valueToAdd) {
        // 原子加法
        int addedValue = atomicAdd(result, *valueToAdd);

        // 通过原子操作后读取值,确保是加法后的值
        addedValue += *valueToAdd;
        printf("Thread %d: Added value: %d\n", threadIdx.x, addedValue);
}

int main() {
        int result = 0;
        int valueToAdd = 5;
        int *d_result, *d_valueToAdd;

        // 在GPU上分配内存
        cudaMalloc((void**)&d_result, sizeof(int));
        cudaMalloc((void**)&d_valueToAdd, sizeof(int));

        // 将数据从主机内存复制到GPU内存
        cudaMemcpy(d_result, &result, sizeof(int), cudaMemcpyHostToDevice);
        cudaMemcpy(d_valueToAdd, &valueToAdd, sizeof(int), cudaMemcpyHostToDevice);

        // 启动CUDA核函数
        atomicAddAndGet << <1, 32 >> > (d_result, d_valueToAdd);

        // 将结果从GPU内存复制回主机内存
        cudaMemcpy(&result, d_result, sizeof(int), cudaMemcpyDeviceToHost);

        // 输出结果
        printf("Result after atomic addition: %d\n", result);

        // 释放GPU上的内存
        cudaFree(d_result);
        cudaFree(d_valueToAdd);

        return 0;
}

结果

相关推荐
岸榕.17 分钟前
551 灌溉
数据结构·c++·算法
old_power2 小时前
图像处理应用中如何实现 C++ 和 Python 的高效通信概述
c++·python·计算机视觉
柠石榴2 小时前
【练习】力扣 热题100 两数之和
开发语言·c++·算法·leetcode
流星白龙3 小时前
【C++】21.map和set的使用
c++
可喜~可乐7 小时前
CAN总线入门指南:从原理到实践
c++·stm32·单片机·硬件工程
数维学长9867 小时前
C++ STL 中的 vector 总结
开发语言·c++
7yewh8 小时前
【LeetCode】力扣刷题热题100道(26-30题)附源码 轮转数组 乘积 矩阵 螺旋矩阵 旋转图像(C++)
c语言·数据结构·c++·算法·leetcode·哈希算法·散列表
白鹭float.10 小时前
【OpenGL/C++】面向对象扩展——测试环境
c++·图形学·opengl
小wanga10 小时前
【C++】类型转换
jvm·c++
我不是程序猿儿10 小时前
【C++】xml烧录 调用twinCat流程自动化
xml·c++·自动化