CUDA小白 - NPP(4) 图像处理 Data Exchange and Initialization(2)

cuda小白

原始API链接 NPP

GPU架构近些年也有不少的变化,具体的可以参考别的博主的介绍,都比较详细。还有一些cuda中的专有名词的含义,可以参考《详解CUDA的Context、Stream、Warp、SM、SP、Kernel、Block、Grid》

常见的NppStatus,可以看这里

如有问题,请指出,谢谢

Convert Bit Depth

主要分为两个大类,一个是数据类型的扩大(8u/s ->16u/s/f -> 32u/s/f),一个是缩小(32u/s -> 16u/s -> 8u/s)。

cpp 复制代码
// Alpha 表示4维图像在变换的过程中是否影响Aplha通道
// Increase Bit Depth
// _Ctx for nppStreamCtx
// R 和 Rs的区别应该是 s涉及到有符号转换为无符号的时候需要添加,conversion with saturarion(饱和度)
// 例如:
//     nppiCOnvert_8u16u_C1R 就是将uint8_t的单通道图像转换为uint16_t的单通道图像
//     nppiCOnvert_32s32u_C1Rs 就是将int32_t的单通道图像转换为uint32_t的单通道图像
NppStatus nppiConvert_[TYPE1][TYPE2]_[Alpha]C[CHANNEL]R(const TYPE1 *pSrc, 
									                    int nSrcStep,
									                    TYPE2 *pDst,
									                    int nDstStep,
									                    NppiSize oSizeROI,
									                    ...);
// Decreased Bit Depth
// 大致用法与上面的一致
// 可以指定四舍五入的模式以及尺度,如果需要指定一般R的后面会跟上Sfs
// 例如:
//    nppiConvert_32u8u_C1RSfs(..., NppRoundMode , int nScaleFactor);
NppStatus nppiConvert_[TYPE1][TYPE2]_[Alpha]C[CHANNEL]R(const TYPE1 *pSrc, 
									                    int nSrcStep,
									                    TYPE2 *pDst,
									                    int nDstStep,
									                    NppiSize oSizeROI,
									                    ...);

需要注意的是,所有16f数据类型的数据 在至少是16字节对齐的时候可以达到最优的性能

Scale Bit Depth

对于每个像素值进行scale的操作,同样也分为升和降两种。

cpp 复制代码
// dstPixelValue = dstMinRangeValue + scaleFactor * (srcPixelValue - srcMinRangeValue)

// _Ctx for nppStreamCtx
// Alpha 表示4维图像在变换的过程中是否影响Aplha通道
// ============== Scale To Higher Bit Depth =================
//    1. 8u -> 16u/s || 32 s
NppStatus nppiScale_[TYPE1][TYPE2]_[Alpha]C[CHANNEL]R(const TYPE1 *pSrc, 
									                  int nSrcStep,
									                   TYPE2 *pDst,
									                   int nDstStep,
									                   NppiSize oSizeROI,
									                   ...);

//    2. 8u -> 32f  限定最小值和最大值
NppStatus nppiScale_8u32f_[Alpha]C[CHANNEL]R(const Npp8u *pSrc, 
						                     int nSrcStep,
						                     Npp32f *pDst,
						                     int nDstStep,
						                     NppiSize oSizeROI,
						                     Npp32f nMin,
						                     Npp32f nMax,
						                     ...);
// ============== Scale To Lower Bit Depth =================

//   1. 16u/s -> 8u || 32s -> 8u
NppStatus nppiScale_[TYPE1][TYPE2]_[Alpha]C[CHANNEL]R(const TYPE1 *pSrc, 
									                  int nSrcStep,
									                  TYPE2 *pDst,
									                  int nDstStep,
									                  NppiSize oSizeROI,
									                  NppHintAlgorithm hint,
									                  ...);
//    2. 32f -> 8u  限定最小值和最大值
NppStatus nppiScale_8u32f_[Alpha]C[CHANNEL]R(const Npp8u *pSrc, 
						                     int nSrcStep,
						                     Npp32f *pDst,
						                     int nDstStep,
						                     NppiSize oSizeROI,
						                     Npp32f nMin,
						                     Npp32f nMax,
						                     ...);

Duplicate Channel

主要是将单个通道的图像重复维多通道图像。

cpp 复制代码
// 以uint8_t的单通道变为三通道
NppStatus nppiDup_8u_C1C3R(const Npp8u *pSrc,
						   int nSrcStep,
						   Npp8u *pDst,
						   int nDstStep,
						   NppiSize oDstSizeROI);

以一个图像转为灰度图,然后调用接口变为三个通道的图像结果,代码比较简单,这里就不贴了,直接上结果。

Transpose

transpose的功能与matrix的transpose比较类型,沿着图像主对角线完成的图像镜像。

cpp 复制代码
NppStatus nppiTranspose_8u_C3R(const Npp8u *pSrc,
							   int nSrcStep,
							   Npp8u *pDst,
							   int nDstStep,
							   NppiSize oSrcROI);	

由于代码也比较简单,这里就直接贴出最终的test结果了。

注意:

  1. 如果图像的宽高不等,则transpose之后的结果对应的step以及存图的时候需要注意一下正确的尺寸值。![请添加图片描述](https://img-blog.csdnimg.cn/04c27760bd3843bcb418bcc107cac01d.png

Swap Channels

当前模块的比较常用的就是RGB和BGR的变换

cpp 复制代码
// 以为uint8_t为例,主要的接口有两个,第一个是输入与输出地址不同,第二个是同一个地址
NppStatus nppiSwapChannels_8u_C3R(const Npp8u *pSrc,
								  int nSrcStep,
								  Npp8u *pDst,
								  int nDstStep,
								  NppiSize oSizeROI,
								  const int aDstOrder[3]);
NppStatus nppiSwapChannels_8u_C3IR(Npp8u *pDst,
								   int nDstStep,
								   NppiSize oSizeROI,
								   const int aDstOrder[3]);

例子也比较简答,使用起来也很方便,这里直接贴结果

相关推荐
一律清风1 小时前
QT-文件创建时间修改器
c++·qt
风清扬_jd2 小时前
Chromium 如何定义一个chrome.settingsPrivate接口给前端调用c++
前端·c++·chrome
Death2002 小时前
Qt 6 相比 Qt 5 的主要提升与更新
开发语言·c++·qt·交互·数据可视化
麻辣韭菜4 小时前
网络基础 【HTTP】
网络·c++·http
阿史大杯茶4 小时前
Codeforces Round 976 (Div. 2 ABCDE题)视频讲解
数据结构·c++·算法
转调5 小时前
每日一练:地下城游戏
开发语言·c++·算法·leetcode
wdxylb5 小时前
使用C++的OpenSSL 库实现 AES 加密和解密文件
开发语言·c++·算法
CSP126366 小时前
特别节目————集训总结
c++
程序猿阿伟6 小时前
《C++游戏人工智能开发:开启智能游戏新纪元》
c++·人工智能·游戏
一线青少年编程教师7 小时前
线性表三——队列queue
数据结构·c++·算法