OpenCV CUDA模块设备层-----在GPU 上高效地执行两个 uint 类型值的最大值比较函数vmax2()

  • 操作系统:ubuntu22.04
  • OpenCV版本:OpenCV4.9
  • IDE:Visual Studio Code
  • 编程语言:C++11

算法描述

OpenCV 的 CUDA 模块(cudev) 中的一个设备端内联函数,用于在 GPU 上高效地执行两个 uint 类型值的最大值比较。

该函数返回两个无符号整数 a 和 b 中的较大值:

bash 复制代码
return (a > b) ? a : b;

函数原型

cpp 复制代码
__device__ __forceinline__ uint cv::cudev::vmax2 	( 	uint  	a,
		uint  	b 
	) 		

参数

  • a uint 第一个无符号整数(通常表示像素值)
  • b uint 第二个无符号整数(另一个像素值或参考值)

返回值

返回 a 和 b 中较大的那个值,类型为 uint。

使用场景

这个函数常用于以下图像/视频处理任务中:

  • 图像增强(如取最大邻域值)
  • 多帧合成中的最大值投影(如天文摄影、医学成像)
  • 构建自定义滤波器(如最大值滤波)
  • GPU 并行像素级比较与选择操作

代码

cpp 复制代码
#include <opencv2/cudev.hpp>
#include <opencv2/cudev/util/simd_functions.hpp>


using namespace cv::cudev;

// CUDA kernel
template <typename T>
__global__ void computeMaxKernel(
    const PtrStep<T> src1,
    const PtrStep<T> src2,
    PtrStep<T> dst,
    int width,
    int height)
{
    int x = blockIdx.x * blockDim.x + threadIdx.x;
    int y = blockIdx.y * blockDim.y + threadIdx.y;

    if (x < width && y < height) {
        uint a = static_cast<uint>(src1(y, x));
        uint b = static_cast<uint>(src2(y, x));
        dst(y, x) = static_cast<T>(vmax2(a, b));  // 取最大值
    }
}

int main() {
    // 加载两张图像
    cv::Mat h_src1 = cv::imread("/media/dingxin/data/study/OpenCV/sources/images/img0.jpg", cv::IMREAD_GRAYSCALE);
    cv::Mat h_src2 = cv::imread("/media/dingxin/data/study/OpenCV/sources/images/img1.jpg", cv::IMREAD_GRAYSCALE);

    if (h_src1.empty() || h_src2.empty()) {
        std::cerr << "Failed to load images!" << std::endl;
        return -1;
    }

    // 上传到 GPU
    cv::cuda::GpuMat d_src1, d_src2, d_max;
    d_src1.upload(h_src1);
    d_src2.upload(h_src2);
    d_max.create(h_src1.size(), h_src1.type());

    // 设置 kernel 参数
    dim3 block(16, 16);
    dim3 grid((d_src1.cols + block.x - 1) / block.x,
              (d_src1.rows + block.y - 1) / block.y);

    // 启动 kernel(显式指定模板参数 uchar)
    computeMaxKernel<uchar><<<grid, block>>>(d_src1, d_src2, d_max, d_src1.cols, d_src1.rows);

    // 下载结果并显示
    cv::Mat h_max;
    d_max.download(h_max);
    cv::imshow("Max Image", h_max);
    cv::waitKey(0);

    return 0;
}

运行结果

相关推荐
陈天伟教授3 小时前
人工智能应用- 语言处理:04.统计机器翻译
人工智能·自然语言处理·机器翻译
Dfreedom.3 小时前
图像处理中的对比度增强与锐化
图像处理·人工智能·opencv·锐化·对比度增强
wenzhangli73 小时前
OoderAgent 企业版 2.0 发布的意义:一次生态战略的全面升级
人工智能·开源
AI_56783 小时前
SQL性能优化全景指南:从量子执行计划到自适应索引的终极实践
数据库·人工智能·学习·adb
cyyt3 小时前
深度学习周报(2.2~2.8)
人工智能·深度学习
阿杰学AI3 小时前
AI核心知识92——大语言模型之 Self-Attention Mechanism(简洁且通俗易懂版)
人工智能·ai·语言模型·自然语言处理·aigc·transformer·自注意力机制
陈天伟教授3 小时前
人工智能应用- 语言处理:03.机器翻译:规则方法
人工智能·自然语言处理·机器翻译
Σίσυφος19003 小时前
PCL 姿态估计 RANSAC + SVD(基于特征匹配)
人工智能·机器学习
Warren2Lynch3 小时前
C4 vs UML:从入门到结合使用的完整指南(含 Visual Paradigm AI 实操)
人工智能·机器学习·uml
Ryan老房3 小时前
智能家居AI-家庭场景物体识别标注实战
人工智能·yolo·目标检测·计算机视觉·ai·智能家居