OpenCV CUDA模块图像处理-----对图像执行 均值漂移过程(Mean Shift Procedure)函数meanShiftProc()

  • 操作系统:ubuntu22.04
  • OpenCV版本:OpenCV4.9
  • IDE:Visual Studio Code
  • 编程语言:C++11

算法描述

执行一个均值漂移过程(mean-shift procedure),并将处理后的点的信息(它们的颜色和位置)存储在两幅图像中。

该函数将源图像中的每个像素映射到一个新的颜色和位置,从而实现:

  • 颜色空间的聚类;
  • 空间位置的平滑;
  • 图像分割或风格化的预处理;

与 cv::cuda::meanShiftFiltering 不同的是,这个函数会输出两个结果:

  • 颜色空间的结果(dstr)
  • 空间位置的结果(dstsp)

函数原型

cpp 复制代码
void cv::cuda::meanShiftProc 	
(
 	InputArray  	src,
	OutputArray  	dstr,
	OutputArray  	dstsp,
	int  	sp,
	int  	sr,
	TermCriteria  	criteria = TermCriteria(TermCriteria::MAX_ITER+TermCriteria::EPS, 5, 1),
	Stream &  	stream = Stream::Null() 
) 		

参数

  • src 源图像。目前仅支持 CV_8UC4 类型的图像(即:8位无符号整型、4通道图像)。
  • dstr 目标图像,包含映射后点的颜色。其尺寸和类型与源图像相同。
  • dstsp 目标图像,包含映射后点的位置。其尺寸与源图像相同,类型为 CV_16SC2(即:16位有符号整型的二维坐标)。
  • sp 空间窗口半径(以像素为单位)。
  • sr 颜色窗口半径(以颜色差异为单位)。
  • criteria 终止条件。参见 TermCriteria 结构体,用于控制算法迭代的最大次数或收敛精度。
  • stream 用于异步版本的 CUDA 流(Stream)。

代码示例

cpp 复制代码
#include <opencv2/cudaimgproc.hpp>
#include <opencv2/opencv.hpp>

int main()
{
    // Step 1: 读取图像并转换为 BGRA(4通道)
    cv::Mat h_src = cv::imread( "/media/dingxin/data/study/OpenCV/sources/images/Lenna.png" );
    if ( h_src.empty() )
    {
        std::cerr << "Failed to load image!" << std::endl;
        return -1;
    }

    cv::Mat h_rgba;
    cv::cvtColor( h_src, h_rgba, cv::COLOR_BGR2BGRA );

    // Step 2: 上传图像到 GPU
    cv::cuda::GpuMat d_src, d_str, d_sp;

    d_src.upload( h_rgba );

    // Step 3: 设置参数
    int sp = 10;  // 空间窗口大小
    int sr = 30;  // 颜色窗口大小

    // Step 4: 执行均值漂移过程
    cv::cuda::meanShiftProc( d_src, d_str, d_sp, sp, sr );

    // Step 5: 下载结果
    cv::Mat h_str, h_sp;
    d_str.download( h_str );  // 新颜色图像(CV_8UC4)
    d_sp.download( h_sp );    // 新空间坐标图像(CV_32FC4 或类似)

    // Step 6: 显示结果
    cv::imshow( "Original Image", h_src );
    cv::imshow( "Color Space Result", h_str );
    cv::waitKey( 0 );

    return 0;
}

运行结果

相关推荐
兵慌码乱10 天前
基于 MediaPipe 与 PySide2 的手势交互音乐控制系统实现:轻量化视觉交互全流程解析
python·opencv·计算机视觉·人机交互·手势识别·mediapipe·pyside2
梦想三三14 天前
OpenCV银行卡数字识别项目(图像预处理与字符分割)
人工智能·opencv·计算机视觉
武子康14 天前
调查研究-180 roboflow/supervision:计算机视觉工程里的“胶水层“,为什么值得关注?
人工智能·opencv·计算机视觉·chatgpt·llm·向量化
m沐沐14 天前
【计算机视觉】OpenCV 模板匹配银行卡数字识别---下
人工智能·python·opencv·计算机视觉·pycharm·numpy
fie888914 天前
SSR / MSR 图像增强
人工智能·opencv·计算机视觉
sali-tec14 天前
C# 基于OpenCv的视觉工作流-章85-包胶不良检测
图像处理·人工智能·opencv·算法·计算机视觉
FL162386312915 天前
[cmake]基于C++使用纯opencv部署ppocrv5v6的onnx模型
开发语言·c++·opencv
搏博15 天前
多传感器融合基础之一图像空间(Image Space)全面解析
图像处理·python·图像空间·融合感知
2401_8856651915 天前
基于OpenCV的模板匹配OCR实战:银行卡与身份证数字识别完整教程
人工智能·python·opencv·计算机视觉·ocr
Robot_Nav15 天前
在非均匀相机抖动去模糊中用IMU辅助的精确模糊核重新估计【文献分析】
图像处理·去运动模糊·imu辅助非盲去卷积