OpenCV CUDA模块设备层-----高效地计算两个 uint 类型值的带权重平均值

  • 操作系统:ubuntu22.04
  • OpenCV版本:OpenCV4.9
  • IDE:Visual Studio Code
  • 编程语言:C++11

算法描述

OpenCV 的 CUDA 模块(cudev) 中的一个设备端内联函数,用于高效地计算两个 uint 类型值的带权重平均值。

该函数返回两个无符号整数 a 和 b 的加权平均值,权重为:

cpp 复制代码
return (a * 3 + b) / 4;

函数原型

cpp 复制代码
__device__ __forceinline__ uint cv::cudev::vavg4(uint a, uint b)

参数

  • a uint 第一个无符号整数(权重为 3)
  • b uint 第二个无符号整数(权重为 1)

代码

cpp 复制代码
#include <opencv2/cudev.hpp>
#include <opencv2/cudev/util/simd_functions.hpp>

using namespace cv::cudev;

// CUDA kernel
template <typename T>
__global__ void computeWeightedAvgKernel(
    const PtrStep<T> src1,
    const PtrStep<T> src2,
    PtrStep<T> dst,
    int width,
    int height)
{
    int x = blockIdx.x * blockDim.x + threadIdx.x;
    int y = blockIdx.y * blockDim.y + threadIdx.y;

    if (x < width && y < height) {
        uint a = static_cast<uint>(src1(y, x));
        uint b = static_cast<uint>(src2(y, x));
        dst(y, x) = static_cast<T>(vavg4(a, b));  // (a*3 + b)/4
    }
}

int main() {
    // 读取两幅图像
    cv::Mat h_src1 = cv::imread("/media/dingxin/data/study/OpenCV/sources/images/img0.jpg", cv::IMREAD_GRAYSCALE);
    cv::Mat h_src2 = cv::imread("/media/dingxin/data/study/OpenCV/sources/images/img1.jpg", cv::IMREAD_GRAYSCALE);

    if (h_src1.empty() || h_src2.empty()) {
        std::cerr << "Failed to load images!" << std::endl;
        return -1;
    }

    // 上传到 GPU
    cv::cuda::GpuMat d_src1, d_src2, d_avg;
    d_src1.upload(h_src1);
    d_src2.upload(h_src2);
    d_avg.create(h_src1.size(), h_src1.type());

    // 设置 kernel 参数
    dim3 block(16, 16);
    dim3 grid((d_src1.cols + block.x - 1) / block.x,
              (d_src1.rows + block.y - 1) / block.y);

    // 启动 kernel(显式指定模板参数 uchar)
    computeWeightedAvgKernel<uchar><<<grid, block>>>(d_src1, d_src2, d_avg, d_src1.cols, d_src1.rows);

    // 下载结果并显示
    cv::Mat h_avg;
    d_avg.download(h_avg);
    cv::imshow("Original Image 1", h_src1);
    cv::imshow("Original Image 2", h_src2);
    cv::imshow("Weighted Averaged Image", h_avg);
    cv::waitKey(0);

    return 0;
}

运行结果

相关推荐
He BianGu几秒前
【项目】Vision Master OpenCV 3.0 版本(预)发行说明
人工智能·数码相机·opencv
无锡布里渊37 分钟前
分布式光纤声波振动与AI的深度融合:开启智慧感知新时代
人工智能·温度监测·线性感温火灾监测·线型感温火灾探测器·光纤振动das·防外破·分布式光纤声波振动
阿里云云原生1 小时前
Qoder 负责人揭秘:Qoder 产品背后的思考与未来发展
人工智能
岁月宁静2 小时前
Vue3.5 + SSE 构建高可用 AI 聊天交互层 ——chat.js 模块架构与实现
前端·vue.js·人工智能
l12345sy2 小时前
Day31_【 NLP _1.文本预处理 _(3)文本数据分析】
人工智能·自然语言处理·数据分析
精灵vector2 小时前
构建自定义AI客户支持助手——LangGraph 中断机制
人工智能·python
算家计算2 小时前
DeepSeek发布新模型!采用全新稀疏注意力架构设计,与国产芯片协同优化
人工智能·开源·deepseek
大囚长2 小时前
从AI角度深入解析和论述哲学的终极答案‘语言即世界‘
人工智能·搜索引擎
北京地铁1号线3 小时前
机器学习笔试选择题:题组2
人工智能·算法·机器学习
算家云3 小时前
OpenAI秘密测试ChatGPT安全路由,情感对话触发GPT-5严格审查
人工智能·chatgpt·算家云·openai秘密测试安全路由·算家计算·租算力,就到算家云