-
cudaArray_t:数据存储的对象,用于存储 2D 或 3D 数据;不涉及纹理的采样(即读取数据时的插值、过滤等操作)。
cudaExtent ca_extent;//定义三维内存区域的结构体 ca_extent.width = vol_in->dim[0]; ca_extent.height = vol_in->dim[1]; ca_extent.depth = vol_in->dim[2]; cudaChannelFormatDesc ca_descriptor = cudaCreateChannelDesc<float>();//定义cudaArray的数据格式,shape和type cudaMalloc3DArray(&state->dev_vol, &ca_descriptor, ca_extent);//分配三维数据块cudaMemcpy3DParms cpy_params = { 0 };//三维内存拷贝操作参数的结构体
cpy_params.extent = ca_extent; //定义三维内存区域的结构体
cpy_params.kind = cudaMemcpyHostToDevice; // 拷贝类型(主机到设备、设备到设备等)
cpy_params.dstArray = state->dev_vol;// 目标数组,和 dstPtr 互斥使用//http://sites.google.com/site/cudaiap2009/cookbook-1#TOC-CUDA-3D-Texture-Example-Gerald-Dall
// The pitched pointer is really tricky to get right. We give the
// pitch of a row, then the number of elements in a row, then the
// height, and we omit the 3rd dimension.
cpy_params.srcPtr = make_cudaPitchedPtr((void*)vol_in->data, ca_extent.width * sizeof(float), ca_extent.width, ca_extent.height);// 源指针,和 srcArray 互斥使用cudaMemcpy3D(&cpy_params);//把vol数据拷贝到显存
-
cudaTextureObject_t:纹理对象;包含数据的地址信息,还包括了如何访问这些数据的元数据(如过滤模式、边界处理、坐标转换等)。高效的图像处理 ,支持自动插值,只读操作
// Specify texture
struct cudaResourceDesc resDesc;//描述资源(如数组、纹理、表面等)的结构体
memset(&resDesc, 0, sizeof(resDesc));
resDesc.resType = cudaResourceTypeArray;//资源是一个 3D 数组。
resDesc.res.array.array = state->dev_vol;// 3D 数组资源// Specify texture object parameters
struct cudaTextureDesc texDesc;//描述纹理(texture)对象属性的结构体
memset(&texDesc, 0, sizeof(texDesc));
texDesc.addressMode[0] = cudaAddressModeWrap;//当坐标超出边界时,纹理坐标会循环回到起始位置。
texDesc.addressMode[1] = cudaAddressModeWrap;//当坐标超出边界时,纹理坐标会循环回到起始位置。
texDesc.filterMode = cudaFilterModeLinear;//当纹理坐标落在两个像素之间时使用最近邻插值。
texDesc.readMode = cudaReadModeElementType;//按纹理的元素类型读取
texDesc.normalizedCoords = 0;//纹理坐标范围通常是像素索引state->tex_vol = 0;//只读纹理内存
cudaCreateTextureObject(&state->tex_vol, &resDesc, &texDesc, NULL); -
cudaSurfaceObject_t。适合需要频繁修改数据,适合需要频繁修改数据,读写操作
// Specify texture
struct cudaResourceDesc resDesc;//描述资源(如数组、纹理、表面等)的结构体
memset(&resDesc, 0, sizeof(resDesc));
resDesc.resType = cudaResourceTypeArray;//资源是一个 3D 数组。
resDesc.res.array.array = state->dev_vol;// 3D 数组资源cudaCreateSurfaceObject(&surfObj, &resDesc);
__global__ void cuda_clear_3d_array_kernel(cudaSurfaceObject_t surf, dim3 kdim) { // calculate surface coordinates unsigned int x = blockIdx.x * blockDim.x + threadIdx.x; unsigned int y = blockIdx.y * blockDim.y + threadIdx.y; unsigned int z = blockIdx.z * blockDim.z + threadIdx.z; // write to memeory if (x < kdim.x && y < kdim.y && z < kdim.z) { surf3Dwrite<float>(0.f, surf, x * 4, y, z, cudaBoundaryModeTrap); } }
cuda的3DArray和TextureObject
shchojj2024-11-14 14:16
相关推荐
onebound_noah9 分钟前
电商图片搜索:技术破局与商业落地,重构“视觉到交易”全链路答案answer18 分钟前
一个超级真实的Three.js树🌲生成器插件朴shu27 分钟前
揭秘高性能协同白板:轻松实现多人实时协作(一)wyjcxyyy28 分钟前
polar靶场-MISC,WEB(中等)2301_8160738330 分钟前
SELinux 学习笔记秋天的一阵风31 分钟前
😱一行代码引发的血案:展开运算符(...)竟让图表功能直接崩了!Hilaku35 分钟前
npm scripts的高级玩法:pre、post和--,你真的会用吗?申阳43 分钟前
Day 12:09. 基于Nuxt开发博客项目-使用NuxtContent构建博客模块合作小小程序员小小店1 小时前
web网页开发,在线短视频管理系统,基于Idea,html,css,jQuery,java,springboot,mysql。n***29321 小时前
前端动画性能优化,减少重绘重排