CUDA原子操作

代码

c 复制代码
#include <cuda_runtime.h>
#include <stdio.h>

__global__ void atomicAddAndGet(int *result, int *valueToAdd) {
        // 原子加法
        int addedValue = atomicAdd(result, *valueToAdd);

        // 通过原子操作后读取值,确保是加法后的值
        addedValue += *valueToAdd;
        printf("Thread %d: Added value: %d\n", threadIdx.x, addedValue);
}

int main() {
        int result = 0;
        int valueToAdd = 5;
        int *d_result, *d_valueToAdd;

        // 在GPU上分配内存
        cudaMalloc((void**)&d_result, sizeof(int));
        cudaMalloc((void**)&d_valueToAdd, sizeof(int));

        // 将数据从主机内存复制到GPU内存
        cudaMemcpy(d_result, &result, sizeof(int), cudaMemcpyHostToDevice);
        cudaMemcpy(d_valueToAdd, &valueToAdd, sizeof(int), cudaMemcpyHostToDevice);

        // 启动CUDA核函数
        atomicAddAndGet << <1, 32 >> > (d_result, d_valueToAdd);

        // 将结果从GPU内存复制回主机内存
        cudaMemcpy(&result, d_result, sizeof(int), cudaMemcpyDeviceToHost);

        // 输出结果
        printf("Result after atomic addition: %d\n", result);

        // 释放GPU上的内存
        cudaFree(d_result);
        cudaFree(d_valueToAdd);

        return 0;
}

结果

相关推荐
Molesidy15 小时前
【VSCode】【Clangd】Win下的基于LLVM/Clangd+Clangd插件+MINGW+CMake的VSCode配置C/C++开发环境的详细教程
c++·ide·vscode·clangd·llvm
Mr_WangAndy16 小时前
C++_chapter13_C++并发与多线程_多线程概念,死锁,unique_lock(),lock_guard()使用
c++·lock·死锁·并发与多线程·unlock·lock_guard·unique_lock
小欣加油17 小时前
leetcode 946 验证栈序列
c++·算法·leetcode·职场和发展
神仙别闹17 小时前
基于QT(C++) 实现哈夫曼压缩(多线程)
java·c++·qt
无敌最俊朗@17 小时前
C++ 并发与同步速查笔记(整理版)
开发语言·c++·算法
神仙别闹18 小时前
基于 C++和 Python 实现计算机视觉
c++·python·计算机视觉
眠りたいです19 小时前
基于脚手架微服务的视频点播系统-客户端业务逻辑处理部分(三)-客户端主体部分完结
c++·微服务·云原生·架构·json·restful·qt6.7
Elnaij19 小时前
从C++开始的编程生活(12)——vector简单介绍和迭代器
开发语言·c++
GISer_Jing19 小时前
OSG底层从Texture读取Image实现:readImageFromCurrentTexture
前端·c++·3d
!chen19 小时前
CPP 学习笔记 语法总结
c++·笔记·学习