OpenCV CUDA模块中矩阵操作------降维操作

  • 操作系统:ubuntu22.04
  • OpenCV版本:OpenCV4.9
  • IDE:Visual Studio Code
  • 编程语言:C++11

算法描述

cv::cuda::reduce 函数用于对 GPU 上的矩阵沿某个维度进行降维操作,例如求和、取最大值等。此函数支持多种降维操作,并允许指定输出数据类型以及使用 CUDA 流进行异步处理。

函数原型

cpp 复制代码
void cv::cuda::reduce
(
    InputArray mtx,      // 输入矩阵
    OutputArray vec,     // 输出向量
    int dim,             // 降维维度:0表示按列,1表示按行
    int reduceOp,        // 降维操作类型(如SUM, AVG, MAX, MIN)
    int dtype = -1,      // 输出数组的数据类型,默认为输入相同类型
    Stream &stream = Stream::Null() // 可选 CUDA 流
);

参数

  • mtx: 输入 GPU 矩阵。

  • vec: 输出 GPU 向量。

  • dim: 指定沿哪个维度进行降维:

    • 0: 按列降维(结果为行向量)。
    • 1: 按行降维(结果为列向量)。
  • reduceOp: 降维操作类型:

    • REDUCE_SUM: 求和。
    • REDUCE_AVG: 平均值。
    • REDUCE_MAX: 最大值。
    • REDUCE_MIN: 最小值。
  • dtype: 输出数组的数据类型。默认为与输入相同类型。

  • stream: 可选 CUDA 流对象,用于异步执行。

代码示例

cpp 复制代码
#include <iostream>
#include <opencv2/cudaarithm.hpp>
#include <opencv2/opencv.hpp>

int main()
{
    // 创建一个测试矩阵
    cv::Mat h_mat = ( cv::Mat_< float >( 3, 3 ) << 1.0f, 2.0f, 3.0f, 4.0f, 5.0f, 6.0f, 7.0f, 8.0f, 9.0f );

    // 上传到 GPU
    cv::cuda::GpuMat d_mat;
    d_mat.upload( h_mat );

    // 存储降维结果的 GpuMat
    cv::cuda::GpuMat d_vec;

    // 创建 CUDA 流
    cv::cuda::Stream stream;

    // 沿列方向(dim=0)进行 SUM 操作
    cv::cuda::reduce( d_mat, d_vec, 0, cv::REDUCE_SUM, -1, stream );
    stream.waitForCompletion();

    // 下载结果并显示
    cv::Mat host_vec_sum_col;
    d_vec.download( host_vec_sum_col );
    std::cout << "Sum along columns: \n" << host_vec_sum_col << std::endl;

    // 沿行方向(dim=1)进行 AVG 操作
    cv::cuda::reduce( d_mat, d_vec, 1, cv::REDUCE_AVG, -1, stream );
    stream.waitForCompletion();

    // 下载结果并显示
    cv::Mat host_vec_avg_row;
    d_vec.download( host_vec_avg_row );
    std::cout << "Average along rows: \n" << host_vec_avg_row << std::endl;

    return 0;
}

运行结果

bash 复制代码
Sum along columns: 
[12, 15, 18]
Average along rows: 
[2;
 5;
 8]
相关推荐
weixin_446260852 小时前
LocalAI:一个免费开源的AI替代方案,让创意更自由!
人工智能·开源
CAE3202 小时前
基于机器学习的智能垃圾短信检测超强系统
人工智能·python·机器学习·自然语言处理·垃圾短信拦截
骄傲的心别枯萎2 小时前
RV1126 NO.37:OPENCV的图像叠加功能
人工智能·opencv·计算机视觉·音视频·视频编解码·rv1126
HyperAI超神经2 小时前
解决蛋白质构象异质性的原子级建模挑战!David Baker团队PLACER框架解析
人工智能·深度学习·ai·ai4s·蛋白质结构
TG:@yunlaoda360 云老大5 小时前
腾讯WAIC发布“1+3+N”AI全景图:混元3D世界模型开源,具身智能平台Tairos亮相
人工智能·3d·开源·腾讯云
这张生成的图像能检测吗5 小时前
(论文速读)Fast3R:在一个向前通道中实现1000+图像的3D重建
人工智能·深度学习·计算机视觉·3d重建
兴趣使然黄小黄8 小时前
【AI-agent】LangChain开发智能体工具流程
人工智能·microsoft·langchain
出门吃三碗饭8 小时前
Transformer前世今生——使用pytorch实现多头注意力(八)
人工智能·深度学习·transformer
l1t8 小时前
利用DeepSeek改写SQLite版本的二进制位数独求解SQL
数据库·人工智能·sql·sqlite
说私域9 小时前
开源AI智能名片链动2+1模式S2B2C商城小程序FAQ设计及其意义探究
人工智能·小程序