OPenCV CUDA模块目标检测----- HOG 特征提取和目标检测类cv::cuda::HOG

  • 操作系统:ubuntu22.04
  • OpenCV版本:OpenCV4.9
  • IDE:Visual Studio Code
  • 编程语言:C++11

算法描述

cv::cuda::HOG 是 OpenCV 的 CUDA 模块中对 HOG 特征提取和目标检测 提供的 GPU 实现。它与 CPU 版本的 cv::HOGDescriptor 类似,但利用了 GPU 的并行计算能力以提高性能。

公共成员函数

创建与初始化

函数 描述
static Ptr cv::cuda::HOG::create() 创建一个默认配置的 HOG 对象。
void setSVMDetector(InputArray _svmDetector) 设置 SVM 分类器权重向量,用于检测特定目标(如行人)。

参数设置(与 HOG 特征相关)

函数 描述
void setWinSize(Size winSize) 设置检测窗口大小(必须是 cell 大小的整数倍)。
void setBlockSize(Size blockSize) 设置 block 的大小(单位:像素)。
void setCellSize(Size cellSize) 设置 cell 的大小(单位:像素)。
void setBinCount(int nBins) 设置每个 cell 的方向直方图 bin 数量。
void setBlockStride(Size blockStride) 设置 block 移动步长(单位:像素)。
void setDerivativeAperture(int derivAperture) 设置图像平滑/导数计算的孔径大小。
void setWinSigma(double winSigma) 高斯窗口的标准差。
void setHistogramNormType(int histogramNormType) 设置直方图归一化方式(L2Hys, L1, L1Sqrt, L2)。
void setL2HysNormalization(bool l2HysNormalization) 是否启用 L2-Hys 归一化。
void setGammaCorrection(bool gammaCorrection) 是否启用伽马校正。
void setNumLevels(int numLevels) 设置金字塔层数。

检测方法

函数 描述
void detectMultiScale(InputArray img, OutputArray foundLocations, double hitThreshold = 0, Size winStride = Size(), Size padding = Size()) 在图像中多尺度检测目标,并返回检测到的位置(矩形框)。

示例代码(GPU 上的行人检测)

cpp 复制代码
#include <opencv2/cudaobjdetect.hpp>
#include <opencv2/opencv.hpp>

int main()
{
    // 创建 HOG 对象
    cv::Ptr< cv::cuda::HOG > hog = cv::cuda::HOG::create();

    // 设置 SVM 分类器(行人检测)
    std::vector< float > detector = cv::HOGDescriptor::getDefaultPeopleDetector();
    hog->setSVMDetector( detector );

    // 读取图像(默认为 BGR 三通道)
    cv::Mat frame = cv::imread( "/media/dingxin/data/study/OpenCV/sources/images/00001.jpg" );
    if ( frame.empty() )
    {
        std::cerr << "无法读取图像!" << std::endl;
        return -1;
    }

    // 转换为灰度图(CV_8UC1)
    cv::Mat gray_frame;
    cv::cvtColor( frame, gray_frame, cv::COLOR_BGR2GRAY );

    // 上传到 GPU
    cv::cuda::GpuMat d_frame( gray_frame );

    // 执行检测
    std::vector< cv::Rect > found_locations;
    hog->detectMultiScale( d_frame, found_locations );

    // 绘制检测结果
    for ( const auto& r : found_locations )
    {
        cv::rectangle( frame, r, cv::Scalar( 0, 0, 255 ), 2 );
    }

    cv::imshow( "Pedestrian Detection", frame );
    cv::waitKey( 0 );
    return 0;
}

运行结果

效果仅供演示,要想效果专业一下,得自己去训练模型了。

相关推荐
延凡科技2 小时前
无人机低空智能巡飞巡检平台:全域感知与智能决策的低空作业中枢
大数据·人工智能·科技·安全·无人机·能源
2501_941329722 小时前
YOLOv8-SEAMHead改进实战:书籍检测与识别系统优化方案
人工智能·yolo·目标跟踪
晓翔仔4 小时前
【深度实战】Agentic AI 安全攻防指南:基于 CSA 红队测试手册的 12 类风险完整解析
人工智能·安全·ai·ai安全
百家方案4 小时前
2026年数据治理整体解决方案 - 全1066页下载
大数据·人工智能·数据治理
北京耐用通信4 小时前
工业自动化中耐达讯自动化Profibus光纤链路模块连接RFID读写器的应用
人工智能·科技·物联网·自动化·信息与通信
小韩博6 小时前
一篇文章讲清AI核心概念之(LLM、Agent、MCP、Skills) -- 从解决问题的角度来说明
人工智能
沃达德软件6 小时前
人工智能治安管控系统
图像处理·人工智能·深度学习·目标检测·计算机视觉·目标跟踪·视觉检测
高工智能汽车7 小时前
爱芯元智通过港交所聆讯,智能汽车芯片市场格局加速重构
人工智能·重构·汽车
大力财经7 小时前
悬架、底盘、制动被同时重构,星空计划想把“驾驶”变成一种系统能力
人工智能
梁下轻语的秋缘8 小时前
Prompt工程核心指南:从入门到精通,让AI精准响应你的需求
大数据·人工智能·prompt