OpenCV CUDA模块中矩阵操作------分布统计类

  • 操作系统:ubuntu22.04
  • OpenCV版本:OpenCV4.9
  • IDE:Visual Studio Code
  • 编程语言:C++11

算法描述

在 OpenCV 的 CUDA 模块中,meanStdDev 函数用于计算矩阵的平均值(Mean)和标准差(StdDev)。这些函数支持同步和异步调用,并且可以接受一个可选的掩码参数来限制计算范围。

函数原型

  1. 同步版本
cpp 复制代码
 void cv::cuda::meanStdDev(InputArray src, Scalar &mean, Scalar &stddev, InputArray mask)

计算带掩码的 GPU 矩阵的平均值和标准差。

cpp 复制代码
 void cv::cuda::meanStdDev(InputArray mtx, Scalar &mean, Scalar &stddev)

计算无掩码的 GPU 矩阵的平均值和标准差。

  1. 异步版本
cpp 复制代码
void cv::cuda::meanStdDev(InputArray src, OutputArray dst, InputArray mask, Stream &stream=Stream::Null())

异步计算带掩码的 GPU 矩阵的平均值和标准差,结果存储在 OutputArray 中。

cpp 复制代码
  void cv::cuda::meanStdDev(InputArray mtx, OutputArray dst, Stream &stream=Stream::Null())

异步计算无掩码的 GPU 矩阵的平均值和标准差,结果存储在 OutputArray 中。

参数

  • InputArray src/mtx: 输入的 GPU 矩阵。
  • Scalar &mean/stddev: 输出的平均值和标准差。
  • InputArray mask: 可选的掩码矩阵,指定哪些元素参与计算,默认为整个矩阵。
  • OutputArray dst: 输出的结果矩阵,通常是一个包含两个 cv::Scalar 值的 GpuMat。
  • Stream &stream: 可选的 CUDA 流对象,用于异步执行,默认使用主线程流。

示例代码

下面是一个完整的 C++ 示例代码,演示了如何使用上述四个函数:

cpp 复制代码
#include <opencv2/opencv.hpp>
#include <opencv2/cudaarithm.hpp>
#include <iostream>

int main() {
    // 创建一个测试矩阵
    cv::Mat h_mat = (cv::Mat_<float>(3, 3) << 
                     1.0f, 2.0f, 3.0f,
                     4.0f, 5.0f, 6.0f,
                     7.0f, 8.0f, 9.0f);

    // 创建一个掩码矩阵(仅允许右下角区域参与计算)
    cv::Mat h_mask = cv::Mat::zeros(h_mat.size(), CV_8UC1);
    cv::rectangle(h_mask, cv::Rect(2, 2, 1, 1), cv::Scalar(255), cv::FILLED); // 右下角像素

    // 上传到 GPU
    cv::cuda::GpuMat d_mat, d_mask;
    d_mat.upload(h_mat);
    d_mask.upload(h_mask);

    // 存储异步结果的 GpuMat
    cv::cuda::GpuMat d_result;

    // 创建 CUDA 流
    cv::cuda::Stream stream;

    // 同步版本 ------------------------------------------------------------------------------------------------

    // 1. 带掩码的 mean 和 stddev
    cv::Scalar mean, stddev;
    cv::cuda::meanStdDev(d_mat, mean, stddev, d_mask);
    std::cout << "Sync Mean with mask: " << mean << std::endl;
    std::cout << "Sync StdDev with mask: " << stddev << std::endl;

    // 2. 不带掩码的 mean 和 stddev
    cv::cuda::meanStdDev(d_mat, mean, stddev);
    std::cout << "Sync Mean without mask: " << mean << std::endl;
    std::cout << "Sync StdDev without mask: " << stddev << std::endl;

    // 异步版本 ------------------------------------------------------------------------------------------------

    // 3. 异步:带掩码的 mean 和 stddev
    cv::cuda::meanStdDev(d_mat, d_result, d_mask, stream);
    stream.waitForCompletion();

    cv::Mat host_result;
    d_result.download(host_result);
    cv::Scalar async_mean = host_result.at<double>(0, 0);
    cv::Scalar async_stddev = host_result.at<double>(1, 0);
    std::cout << "Async Mean with mask: " << async_mean << std::endl;
    std::cout << "Async StdDev with mask: " << async_stddev << std::endl;

    // 4. 异步:不带掩码的 mean 和 stddev
    cv::cuda::meanStdDev(d_mat, d_result, stream);
    stream.waitForCompletion();

    d_result.download(host_result);
    async_mean = host_result.at<double>(0, 0);
    async_stddev = host_result.at<double>(1, 0);
    std::cout << "Async Mean without mask: " << async_mean << std::endl;
    std::cout << "Async StdDev without mask: " << async_stddev << std::endl;

    return 0;
}

运行结果

bash 复制代码
Sync Mean with mask: [9, 0, 0, 0]
Sync StdDev with mask: [0, 0, 0, 0]
Sync Mean without mask: [5, 0, 0, 0]
Sync StdDev without mask: [2.58199, 0, 0, 0]
Async Mean with mask: [9, 0, 0, 0]
Async StdDev with mask: [0, 0, 0, 0]
Async Mean without mask: [5, 0, 0, 0]
Async StdDev without mask: [0, 0, 0, 0]
相关推荐
UMI赋能企业几秒前
制造业流程自动化提升生产力的全面分析
大数据·人工智能
说私域28 分钟前
“开源AI大模型AI智能名片S2B2C商城小程序”视角下的教育用户策略研究
人工智能·小程序
JANGHIGH1 小时前
YOLO系列——Ubuntu20.04下通过conda虚拟环境源码安装opencv-4.10与opencv_contrib-4.10.0
opencv·yolo·conda
gddkxc1 小时前
AI CRM中的数据分析:悟空AI CRM如何帮助企业优化运营
人工智能·信息可视化·数据分析
AI视觉网奇1 小时前
Python 检测运动模糊 源代码
人工智能·opencv·计算机视觉
东隆科技1 小时前
PRIMES推出SFM 2D全扫描场分析仪革新航空航天LPBF激光增材制造
人工智能·制造
无风听海1 小时前
神经网络之计算图repeat节点
人工智能·深度学习·神经网络
刘晓倩2 小时前
在PyCharm中创建项目并练习
人工智能
Dev7z2 小时前
阿尔茨海默病早期症状影像分类数据集
人工智能·分类·数据挖掘
神码小Z2 小时前
DeepSeek再开源3B-MoE-OCR模型,视觉压缩高达20倍,支持复杂图表解析等多模态能力!
人工智能