OpenCV CUDA模块中矩阵操作------分布统计类

  • 操作系统:ubuntu22.04
  • OpenCV版本:OpenCV4.9
  • IDE:Visual Studio Code
  • 编程语言:C++11

算法描述

在 OpenCV 的 CUDA 模块中,meanStdDev 函数用于计算矩阵的平均值(Mean)和标准差(StdDev)。这些函数支持同步和异步调用,并且可以接受一个可选的掩码参数来限制计算范围。

函数原型

  1. 同步版本
cpp 复制代码
 void cv::cuda::meanStdDev(InputArray src, Scalar &mean, Scalar &stddev, InputArray mask)

计算带掩码的 GPU 矩阵的平均值和标准差。

cpp 复制代码
 void cv::cuda::meanStdDev(InputArray mtx, Scalar &mean, Scalar &stddev)

计算无掩码的 GPU 矩阵的平均值和标准差。

  1. 异步版本
cpp 复制代码
void cv::cuda::meanStdDev(InputArray src, OutputArray dst, InputArray mask, Stream &stream=Stream::Null())

异步计算带掩码的 GPU 矩阵的平均值和标准差,结果存储在 OutputArray 中。

cpp 复制代码
  void cv::cuda::meanStdDev(InputArray mtx, OutputArray dst, Stream &stream=Stream::Null())

异步计算无掩码的 GPU 矩阵的平均值和标准差,结果存储在 OutputArray 中。

参数

  • InputArray src/mtx: 输入的 GPU 矩阵。
  • Scalar &mean/stddev: 输出的平均值和标准差。
  • InputArray mask: 可选的掩码矩阵,指定哪些元素参与计算,默认为整个矩阵。
  • OutputArray dst: 输出的结果矩阵,通常是一个包含两个 cv::Scalar 值的 GpuMat。
  • Stream &stream: 可选的 CUDA 流对象,用于异步执行,默认使用主线程流。

示例代码

下面是一个完整的 C++ 示例代码,演示了如何使用上述四个函数:

cpp 复制代码
#include <opencv2/opencv.hpp>
#include <opencv2/cudaarithm.hpp>
#include <iostream>

int main() {
    // 创建一个测试矩阵
    cv::Mat h_mat = (cv::Mat_<float>(3, 3) << 
                     1.0f, 2.0f, 3.0f,
                     4.0f, 5.0f, 6.0f,
                     7.0f, 8.0f, 9.0f);

    // 创建一个掩码矩阵(仅允许右下角区域参与计算)
    cv::Mat h_mask = cv::Mat::zeros(h_mat.size(), CV_8UC1);
    cv::rectangle(h_mask, cv::Rect(2, 2, 1, 1), cv::Scalar(255), cv::FILLED); // 右下角像素

    // 上传到 GPU
    cv::cuda::GpuMat d_mat, d_mask;
    d_mat.upload(h_mat);
    d_mask.upload(h_mask);

    // 存储异步结果的 GpuMat
    cv::cuda::GpuMat d_result;

    // 创建 CUDA 流
    cv::cuda::Stream stream;

    // 同步版本 ------------------------------------------------------------------------------------------------

    // 1. 带掩码的 mean 和 stddev
    cv::Scalar mean, stddev;
    cv::cuda::meanStdDev(d_mat, mean, stddev, d_mask);
    std::cout << "Sync Mean with mask: " << mean << std::endl;
    std::cout << "Sync StdDev with mask: " << stddev << std::endl;

    // 2. 不带掩码的 mean 和 stddev
    cv::cuda::meanStdDev(d_mat, mean, stddev);
    std::cout << "Sync Mean without mask: " << mean << std::endl;
    std::cout << "Sync StdDev without mask: " << stddev << std::endl;

    // 异步版本 ------------------------------------------------------------------------------------------------

    // 3. 异步:带掩码的 mean 和 stddev
    cv::cuda::meanStdDev(d_mat, d_result, d_mask, stream);
    stream.waitForCompletion();

    cv::Mat host_result;
    d_result.download(host_result);
    cv::Scalar async_mean = host_result.at<double>(0, 0);
    cv::Scalar async_stddev = host_result.at<double>(1, 0);
    std::cout << "Async Mean with mask: " << async_mean << std::endl;
    std::cout << "Async StdDev with mask: " << async_stddev << std::endl;

    // 4. 异步:不带掩码的 mean 和 stddev
    cv::cuda::meanStdDev(d_mat, d_result, stream);
    stream.waitForCompletion();

    d_result.download(host_result);
    async_mean = host_result.at<double>(0, 0);
    async_stddev = host_result.at<double>(1, 0);
    std::cout << "Async Mean without mask: " << async_mean << std::endl;
    std::cout << "Async StdDev without mask: " << async_stddev << std::endl;

    return 0;
}

运行结果

bash 复制代码
Sync Mean with mask: [9, 0, 0, 0]
Sync StdDev with mask: [0, 0, 0, 0]
Sync Mean without mask: [5, 0, 0, 0]
Sync StdDev without mask: [2.58199, 0, 0, 0]
Async Mean with mask: [9, 0, 0, 0]
Async StdDev with mask: [0, 0, 0, 0]
Async Mean without mask: [5, 0, 0, 0]
Async StdDev without mask: [0, 0, 0, 0]
相关推荐
haf-Lydia3 分钟前
金融科技的数字底座
人工智能·科技·金融
shengjk15 分钟前
多智能体大语言模型系统频频翻车?三大失败根源与解决方案全解析
人工智能
安思派Anspire11 分钟前
用 LangGraph 构建第一个 AI 智能体完全指南(一)
人工智能
广州正荣13 分钟前
Scrapy-Redis分布式爬虫架构的可扩展性与容错性增强:基于微服务与容器化的解决方案
人工智能·爬虫·科技
加油搞钱加油搞钱15 分钟前
鹰盾加密器基于AI的视频个性化压缩技术深度解析:从智能分析到无损压缩实践
人工智能·音视频·视频加密·鹰盾加密·鹰盾播放器
Baihai_IDP17 分钟前
OCR 识别质量如何影响 RAG 系统的性能?有何解决办法?
人工智能·llm·aigc
新智元18 分钟前
20 人团队提前实现 DeepSeek 构想,AI 算力变天?直击大模型算力成本痛点
人工智能·openai
硬核隔壁老王24 分钟前
从零开始搭建RAG系统系列(十):RAG系统性能优化技巧-生成模块优化 (Optimizing Generator)
人工智能·程序员·llm
机器之心29 分钟前
刚刚,OpenAI正式发布o3-pro!奥特曼激动更新博客:温和的奇点
人工智能·ai编程
硬核隔壁老王32 分钟前
从零开始搭建RAG系统系列(九):RAG系统性能优化技巧-检索模块优化 (Optimizing Retriever)
人工智能·程序员·llm