opencv+opencv_contrib+cuda和VS2022编译

本文介绍使用OpenCV和OpenCV_Contrib源码及Cuda进行编译的过程,编译过程中会用到OpenCV、OpenCV_Contrib、CUDA Toolkit、cuDNN、Cmake、VS2022等工具,最终编译OpenCV的Cuda版本。

一、OpenCV下载地址

OpenCV官网下载地址:https://opencv.org/releases/#,选择一个版本下载,下载之后解压或者提取;

OpenCV Gihthub下载地址:https://github.com/opencv/opencv;也可以在Github选择一个版本下载,下载之后解压;

注:从官网使用下载器下载的OpenCV解压后会多一个build文件夹,是已经编译的opencv文件,直接从Github下载的没有这个文件夹,因为需要自己编译Cuda版本的opencv,所以不会用到这个build文件夹,有没有都不影响;

图中左侧opencv4.11.0文件夹就是右侧的sources文件夹(下图)

二、OpenCV_contrib下载地址

OpenCV Gihthub下载地址:https://github.com/opencv/opencv_contrib,和下载OpenCV相同的方式进行下载,注意OpenCV_contrib的版本要与下载的OpenCV的版本一致 。下载后解压;

下图中的cuda开头的文件夹就是与cuda相关的文件,

三、Cmake下载

下载Cmake:https://cmake.org/download/,我使用的Cmake4.0.1;

四、Cuda Toolkit下载

1.查看CUDA最高支持版本

在命令窗口中使用nvidia-smi查看电脑的显卡支持的CUDA Toolkit版本(如果nvidia-smi不可用,可能是命令行输错了或者没安装显卡驱动,检查命令行或者下载驱动:https://www.nvidia.cn/drivers/lookup/),下图中CUDA Version12.6代表最高支持CUDA Toolkit12.6的版本;

2.下载CudaToolkit

下载地址:https://developer.nvidia.com/cuda-downloads,下载完成后,进行安装,安装后

在C:\Program Files会有NVIDIA GPU Computing Toolkit文件夹;

3.环境变量配置

安装完成后,系统环境变量中会有以下两个路径;

在环境变量Path中,需要添加以下路径(前两个是安装后自动添加的,所以只需要添加最后一个x64的路径就行):

4.检查CUDA Toolkit版本

在命令窗口输入 nvcc -V(中间有空格)会显示电脑安装的CUDA Toolkit的版本号;

五、cuDNN下载

下载地址:https://developer.nvidia.com/cudnn,下载完成后,将其中的bin文件,lib文件夹,include文件夹,三个文件夹中的文件复制到对应的cuda文件夹中,即C:\Program Files\NVIDIA GPU Computing Toolkit\CUDA\v12.2文件夹的对应目录中(v12.2是CUDA的版本号,我下载的是12.2),如果不使用cuDNN可以跳过此步骤;

六、编译

1.opencv编译

1.打开Cmake,首先编译opencv,选择Opencv源码文件夹,之后选择新的build文件夹,如下图新建一个build文件夹,我的build文件夹名字为cudaopencv1:

点击左下角的Configure,会弹出以下界面,选择generator,我需要使用的是VS2022,所以我选择的是Visual Studio 17 2022 (根据自己的需求选择),之后点击Finish:

2.Configure完成后会有以下界面,Configure过程中会显示warning,提示你cmake版本要求或者文件未找到,可以一个一个查看,不是自己需编译的文件就不用管(也可以直接取消勾选,不进行编译);

3.点击Generate,下方会显示Generating done.

4.至此build文件夹(我的build文件夹名为cudaopencv1)中会出现以下文件:

2.OpenCV生成

1.双击打开生成的OpenCV.sln,

2.在VS中设置编译环境Debug或者Release,之后在解决方案管理器中找到CmakeTargerts,右键点击其中的ALL_BUILD,点击生成;

3.在自己的build文件夹中会生成lib文件夹,如下所示

lib文件夹中的内容是刚刚生成的文件,如果是在Debug模式下生成就会有Debug文件夹,如果是Release模式就会有Release文件夹,两种模式都生成,两个文件夹都有;

文件夹中是生成的库文件:

3.编译contrib及CUDA

1.在Cmake中找到OPENCV_EXTRA_MODULES_PATH,设置文件夹为opencv_contrib文件中的modules文件夹路径,我的opencv_contrib路径为:D:/OpenCV4.11/opencv_contrib-4.11.0/modules,如下图:

2.在cmake的search中输入cuda,设置BUILD中的BUILD_CUDA_STUBS为勾选状态,设置WITH中的WITH_CUDA为勾选状态;

3.设置完成后,点击下方的Configure,最下方显示Configuring done.

4.完成Generate之后设置显卡算力参数,在Cmake的Search中搜索ARCH,设置CUDA_ARCH_BIN参数为自己的显卡算力,我的显卡算力为8.6,具体自己的显卡算力可以在Nvidia网站查询:https://developer.nvidia.com/cuda-gpus

注意:在未点击Generate时搜索不到这个参数,完成一次Generate后才可以搜到这个参数,如果不设置这个参数会导致后边的cudaopencv编译失败;

5.设置CUDA_FAST_MATH为勾选状态:

点击Configure,显示Configuring done后,点击Generate,Generating done

6.检查是否编译成功

a.在Camke的白色区域 中,Build中会显示以下目录:

b.在自己的build文件夹中的modules文件夹中(我的build文件夹名字为cudaopencv1),会有以下文件,

至此opencv cuda版本的build完成。

4.使用VS进行生成

打开build文件夹(cudaopencv1),找到OpenCV.sln,双击打开;

在CmakeTargets中找到ALL_BUILD,右键点击生成(此过程比较长,我用了18分钟),

生成完成后,查看自己的build文件夹的lib文件夹,发现与之前相比会多出contrib中的内容

之后点击INSTALL 中的仅用于项目仅生成INSTALL ,点击后会在build文件夹中生成一个install文件夹,文件夹中的内容就是编译的全部内容。

install文件夹中的内容:

这里边都是debug模式下编译的库文件,如果需要release模式,在ALL_BUILD生成时,在VS中选择Release,然后再生成INSTALL。

至此,opencv +contrib+cuda编译全部完成。

七、配置及使用

1.配置环境变量

在此电脑->属性->高级系统设置->环境变量->系统变量->Path中增加编译的bin文件夹;

2.配置项目属性

首先配置项目包含目录,在包含目录中添加:D:\OpenCV4.11\cudaopencv1\install\include 和 D:\OpenCV4.11\cudaopencv1\install\include\opencv2;

在库目录中,配置D:\OpenCV4.11\cudaopencv1\install\x64\vc17\lib

在链接器->输入->附加依赖项中,加入build文件夹中所有lib文件名称,文件名很多,所以可以使用命令行一次性全部转换为文本,然后直接复制(详见3.获取所有lib文件名称

3.获取所有lib文件名称

在命令窗口中输入:dir /b "文件路径">生成的文本路径;

例如以下截图,会将lib文件夹中的所有文件名字存放到C盘的name文本中;

4.验证是否可用

使用以下代码可以获取编译信息及电脑的GPU数量,则可以正常使用;

cpp 复制代码
#include <iostream>
#include <opencv2/opencv.hpp>
#include <opencv2/cudafilters.hpp>
#include <opencv2/cudaimgproc.hpp>
int main() 
{
    std::cout << "OpenCV built with CUDA: " << cv::getBuildInformation() << std::endl;//获取编译信息,如下图
    int num_devices = cv::cuda::getCudaEnabledDeviceCount();//获取电脑显卡数量
    std::cout << "Number of CUDA devices: " << num_devices << std::endl;
    return 0;
}

如果编译正常,使用getBuildInformation()函数可以看到NVIDIA CDUA的状态为YES,而且可以看到显卡的计算能力;

使用cuda::getCudaEnabledDeviceCount()可以获取到电脑的显卡数量(如下图,电脑只有一个显卡,获取的结果也是1);

八、汇总

使用的编译工具及版本如下,如果有需要编译完成的文件,可以在评论区留下邮箱;

九、编译过程中可能遇到的问题

1.所有步骤均按照以上过程操作,但是在VS生成过程中,显示:

27>D:\OpenCV4.5.5\opencv\sources\modules\core\include\opencv2/core/cuda/common.hpp(99,27): error C4430: 缺少类型说明符 - 假定为 int。注意: C++ 不支持默认 int (编译源文件D:\OpenCV4.5.5\opencv\cudaopencv\modules\core\arithm.sse4_1.cpp)

产生这个问题大概率是由于cuda版本与opencv版本的兼容问题,我最开始使用OpenCV4.5.5和CUDA 12.2版本,出现这个问题,后来换成OpenCV4.11和CUDA12.2,编译成功

2.在Cmake过程中出现以下错误,显示:

CMake Error at cmake/OpenCVDetectCUDAUtils.cmake:297 (list):

list GET given empty list

Call Stack (most recent call first):

cmake/OpenCVDetectCUDA.cmake:76 (ocv_set_cuda_arch_bin_and_ptx)

cmake/OpenCVFindLibsPerf.cmake:46 (include)

CMakeLists.txt:800 (include)

cmake检测CUDA架构时未能正确识别电脑GPU的计算能力,如果出现这个问题,在cmake中设置CUDA_ARCH_BIN的值,GPU计算能力查询https://developer.nvidia.com/cuda-gpus

相关推荐
夏子曦1 分钟前
AI——认知建模工具:ACT-R
人工智能·机器学习·ai
studyer_domi14 分钟前
Matlab 基于Hough变换的人眼虹膜定位方法
人工智能·计算机视觉
qq_4369621824 分钟前
AI数据分析中的伪需求场景:现状、挑战与突破路径
人工智能·数据挖掘·数据分析·ai数据分析
layneyao44 分钟前
AI与计算机视觉(CV):目标检测与图像分割的最新进展
人工智能·目标检测·计算机视觉
Clocky71 小时前
机器学习-数据集划分和特征工程
人工智能·深度学习·机器学习
机器学习之心HML1 小时前
Transformer编码器+SHAP分析,模型可解释创新表达!
人工智能·深度学习·transformer
多巴胺与内啡肽.1 小时前
OpenCV进阶操作:角点检测
人工智能·opencv·计算机视觉
鸿蒙布道师1 小时前
ChatGPT深度研究功能革新:GitHub直连与强化微调
人工智能·深度学习·神经网络·自然语言处理·chatgpt·数据挖掘·github
小刘私坊1 小时前
人工智能与生命科学的深度融合:破解生物医学难题,引领未来科技革命
人工智能·科技