OpenCV CUDA模块设备层-----高效地计算两个 uint 类型值的带权重平均值

  • 操作系统:ubuntu22.04
  • OpenCV版本:OpenCV4.9
  • IDE:Visual Studio Code
  • 编程语言:C++11

算法描述

OpenCV 的 CUDA 模块(cudev) 中的一个设备端内联函数,用于高效地计算两个 uint 类型值的带权重平均值。

该函数返回两个无符号整数 a 和 b 的加权平均值,权重为:

cpp 复制代码
return (a * 3 + b) / 4;

函数原型

cpp 复制代码
__device__ __forceinline__ uint cv::cudev::vavg4(uint a, uint b)

参数

  • a uint 第一个无符号整数(权重为 3)
  • b uint 第二个无符号整数(权重为 1)

代码

cpp 复制代码
#include <opencv2/cudev.hpp>
#include <opencv2/cudev/util/simd_functions.hpp>

using namespace cv::cudev;

// CUDA kernel
template <typename T>
__global__ void computeWeightedAvgKernel(
    const PtrStep<T> src1,
    const PtrStep<T> src2,
    PtrStep<T> dst,
    int width,
    int height)
{
    int x = blockIdx.x * blockDim.x + threadIdx.x;
    int y = blockIdx.y * blockDim.y + threadIdx.y;

    if (x < width && y < height) {
        uint a = static_cast<uint>(src1(y, x));
        uint b = static_cast<uint>(src2(y, x));
        dst(y, x) = static_cast<T>(vavg4(a, b));  // (a*3 + b)/4
    }
}

int main() {
    // 读取两幅图像
    cv::Mat h_src1 = cv::imread("/media/dingxin/data/study/OpenCV/sources/images/img0.jpg", cv::IMREAD_GRAYSCALE);
    cv::Mat h_src2 = cv::imread("/media/dingxin/data/study/OpenCV/sources/images/img1.jpg", cv::IMREAD_GRAYSCALE);

    if (h_src1.empty() || h_src2.empty()) {
        std::cerr << "Failed to load images!" << std::endl;
        return -1;
    }

    // 上传到 GPU
    cv::cuda::GpuMat d_src1, d_src2, d_avg;
    d_src1.upload(h_src1);
    d_src2.upload(h_src2);
    d_avg.create(h_src1.size(), h_src1.type());

    // 设置 kernel 参数
    dim3 block(16, 16);
    dim3 grid((d_src1.cols + block.x - 1) / block.x,
              (d_src1.rows + block.y - 1) / block.y);

    // 启动 kernel(显式指定模板参数 uchar)
    computeWeightedAvgKernel<uchar><<<grid, block>>>(d_src1, d_src2, d_avg, d_src1.cols, d_src1.rows);

    // 下载结果并显示
    cv::Mat h_avg;
    d_avg.download(h_avg);
    cv::imshow("Original Image 1", h_src1);
    cv::imshow("Original Image 2", h_src2);
    cv::imshow("Weighted Averaged Image", h_avg);
    cv::waitKey(0);

    return 0;
}

运行结果

相关推荐
飞哥数智坊31 分钟前
openclaw 不是全站第一!但它的爆发,足以引人深思
人工智能
zone77392 小时前
001:LangChain的LCEL语法学习
人工智能·后端·面试
程序员鱼皮2 小时前
微软竟然出了免费的 AI 应用开发课?!我已经学上了
人工智能·程序员·ai编程
DevnullCoffe2 小时前
基于 OpenClaw + Pangolinfo API 的 Amazon 价格监控系统:架构设计与最佳实践
人工智能·架构
Baihai_IDP2 小时前
回头看 RLHF、PPO、DPO、GRPO 与 RLVR 的发展路径
人工智能·llm·强化学习
aristotle3 小时前
Openclow安装保姆级教程
人工智能·程序员
明明如月学长3 小时前
从 Subagent 到 Team:Claude Code 把 AI 协同玩明白了
人工智能
叶落阁主3 小时前
揭秘 Happy:如何实现 AI 编程助手输出的实时同步
人工智能·claude·vibecoding
王鑫星3 小时前
Anthropic 把自己发明的协议捐了:MCP 入驻 Linux 基金会,OpenAI 竟然也签了名
人工智能
陈少波AI应用笔记3 小时前
OpenClaw安全实测:4种攻击方式与防护指南
人工智能