OpenCV CUDA模块设备层-----高效地计算两个 uint 类型值的带权重平均值

  • 操作系统:ubuntu22.04
  • OpenCV版本:OpenCV4.9
  • IDE:Visual Studio Code
  • 编程语言:C++11

算法描述

OpenCV 的 CUDA 模块(cudev) 中的一个设备端内联函数,用于高效地计算两个 uint 类型值的带权重平均值。

该函数返回两个无符号整数 a 和 b 的加权平均值,权重为:

cpp 复制代码
return (a * 3 + b) / 4;

函数原型

cpp 复制代码
__device__ __forceinline__ uint cv::cudev::vavg4(uint a, uint b)

参数

  • a uint 第一个无符号整数(权重为 3)
  • b uint 第二个无符号整数(权重为 1)

代码

cpp 复制代码
#include <opencv2/cudev.hpp>
#include <opencv2/cudev/util/simd_functions.hpp>

using namespace cv::cudev;

// CUDA kernel
template <typename T>
__global__ void computeWeightedAvgKernel(
    const PtrStep<T> src1,
    const PtrStep<T> src2,
    PtrStep<T> dst,
    int width,
    int height)
{
    int x = blockIdx.x * blockDim.x + threadIdx.x;
    int y = blockIdx.y * blockDim.y + threadIdx.y;

    if (x < width && y < height) {
        uint a = static_cast<uint>(src1(y, x));
        uint b = static_cast<uint>(src2(y, x));
        dst(y, x) = static_cast<T>(vavg4(a, b));  // (a*3 + b)/4
    }
}

int main() {
    // 读取两幅图像
    cv::Mat h_src1 = cv::imread("/media/dingxin/data/study/OpenCV/sources/images/img0.jpg", cv::IMREAD_GRAYSCALE);
    cv::Mat h_src2 = cv::imread("/media/dingxin/data/study/OpenCV/sources/images/img1.jpg", cv::IMREAD_GRAYSCALE);

    if (h_src1.empty() || h_src2.empty()) {
        std::cerr << "Failed to load images!" << std::endl;
        return -1;
    }

    // 上传到 GPU
    cv::cuda::GpuMat d_src1, d_src2, d_avg;
    d_src1.upload(h_src1);
    d_src2.upload(h_src2);
    d_avg.create(h_src1.size(), h_src1.type());

    // 设置 kernel 参数
    dim3 block(16, 16);
    dim3 grid((d_src1.cols + block.x - 1) / block.x,
              (d_src1.rows + block.y - 1) / block.y);

    // 启动 kernel(显式指定模板参数 uchar)
    computeWeightedAvgKernel<uchar><<<grid, block>>>(d_src1, d_src2, d_avg, d_src1.cols, d_src1.rows);

    // 下载结果并显示
    cv::Mat h_avg;
    d_avg.download(h_avg);
    cv::imshow("Original Image 1", h_src1);
    cv::imshow("Original Image 2", h_src2);
    cv::imshow("Weighted Averaged Image", h_avg);
    cv::waitKey(0);

    return 0;
}

运行结果

相关推荐
思绪无限2 小时前
YOLOv5至YOLOv12升级:木材表面缺陷检测系统的设计与实现(完整代码+界面+数据集项目)
人工智能·深度学习·目标检测·计算机视觉·木材表面缺陷检测
kishu_iOS&AI2 小时前
深度学习 —— 损失函数
人工智能·pytorch·python·深度学习·线性回归
好运的阿财2 小时前
OpenClaw工具拆解之canvas+message
人工智能·python·ai编程·openclaw·openclaw工具
TechubNews2 小时前
新火集团首席经济学家付鹏演讲——2026 年是 Crypto 加入到 FICC 资产配置框架元年
大数据·人工智能
蒸汽求职2 小时前
跨越 CRUD 内卷:半导体产业链与算力基建下的软件工程新生态
人工智能·科技·面试·职场和发展·软件工程·制造
DeepModel2 小时前
通俗易懂讲透 Q-Learning:从零学会强化学习核心算法
人工智能·学习·算法·机器学习
聊点儿技术3 小时前
LLM数据采集如何突破AI反爬?——用IP数据接口实现进阶
人工智能·数据分析·产品运营·ip·电商·ip地址查询·ip数据接口
小兵张健3 小时前
一场大概率没拿到 offer 的面试,让我更坚定去做喜欢的事
人工智能·面试·程序员
2501_940041743 小时前
AI创建小游戏指令词
人工智能·游戏·prompt
AC赳赳老秦3 小时前
OpenClaw二次开发实战:编写专属办公自动化技能,适配个性化需求
linux·javascript·人工智能·python·django·测试用例·openclaw