【opencv】示例-stereo_match.cpp 立体匹配:通过对左右视图图像进行处理来生成视差图和点云数据...

cpp 复制代码
/*
 *  stereo_match.cpp
 *  calibration
 *
 *  创建者 Victor Eruhimov,日期为 2010年1月18日。
 *  版权所有 2010 Argus Corp.
 *
 */


#include "opencv2/calib3d/calib3d.hpp" // 导入OpenCV相机标定和三维重建相关的头文件
#include "opencv2/imgproc.hpp" // 导入OpenCV图像处理相关的头文件
#include "opencv2/imgcodecs.hpp" // 导入OpenCV图像编解码相关的头文件
#include "opencv2/highgui.hpp" // 导入OpenCV高层GUI(图形界面)相关的头文件
#include "opencv2/core/utility.hpp" // 导入OpenCV核心工具(utility)模块的头文件


#include <stdio.h> // 导入C标准输入输出头文件
#include <sstream> // 导入C++字符串流处理头文件


using namespace cv; // 使用OpenCV的命名空间


// 声明了print_help函数,用于显示帮助信息
static void print_help(char** argv)
{
    // 打印使用demo时的帮助信息
    printf("\nDemo stereo matching converting L and R images into disparity and point clouds\n");
    // 打印程序使用方式的说明
    printf("\nUsage: %s <left_image> <right_image> [--algorithm=bm|sgbm|hh|hh4|sgbm3way] [--blocksize=<block_size>]\n"
           "[--max-disparity=<max_disparity>] [--scale=scale_factor>] [-i=<intrinsic_filename>] [-e=<extrinsic_filename>]\n"
           "[--no-display] [--color] [-o=<disparity_image>] [-p=<point_cloud_file>]\n", argv[0]);
}


// 声明了saveXYZ函数,用于将三维点云数据保存到文件
static void saveXYZ(const char* filename, const Mat& mat)
{
    // 设置三维点深度的最大值
    const double max_z = 1.0e4;
    // 以文本写入方式打开文件
    FILE* fp = fopen(filename, "wt");
    // 遍历图像的每个像素点
    for(int y = 0; y < mat.rows; y++)
    {
        for(int x = 0; x < mat.cols; x++)
        {
            // 读取每个像素点的三维坐标
            Vec3f point = mat.at<Vec3f>(y, x);
            // 如果该点的Z坐标无效,则忽略此点
            if(fabs(point[2] - max_z) < FLT_EPSILON || fabs(point[2]) > max_z) continue;
            // 将有效的三维坐标写入到文件中
            fprintf(fp, "%f %f %f\n", point[0], point[1], point[2]);
        }
    }
    // 关闭文件
    fclose(fp);
}


int main(int argc, char** argv)
{
    // 定义了一系列的字符串变量用来存储命令行参数
    std::string img1_filename = "";
    std::string img2_filename = "";
    std::string intrinsic_filename = "";
    std::string extrinsic_filename = "";
    std::string disparity_filename = "";
    std::string point_cloud_filename = "";


    // 定义了枚举类型,列出了所有双目算法
    enum { STEREO_BM=0, STEREO_SGBM=1, STEREO_HH=2, STEREO_VAR=3, STEREO_3WAY=4, STEREO_HH4=5 };
    int alg = STEREO_SGBM; // 默认使用STEREO_SGBM算法
    int SADWindowSize, numberOfDisparities; // 定义了SAD窗口大小和视差的数量
    bool no_display; // 定义了是否显示结果的标志位
    bool color_display; // 定义了是否彩色显示视差图的标志位
    float scale; // 定义了缩放因子


    // 创建两种双目匹配算法实例对象:StereoBM和StereoSGBM
    Ptr<StereoBM> bm = StereoBM::create(16,9);
    Ptr<StereoSGBM> sgbm = StereoSGBM::create(0,16,3);


    // 使用命令行解析器解析参数
    cv::CommandLineParser parser(argc, argv,
        "{@arg1||}{@arg2||}{help h||}{algorithm||}{max-disparity|0|}{blocksize|0|}{no-display||}{color||}{scale|1|}{i||}{e||}{o||}{p||}");
    // 如果用户请求帮助,则调用print_help函数并退出
    if(parser.has("help"))
    {
        print_help(argv);
        return 0;
    }
    // 获取命令行中指定的左右图像文件名
    img1_filename = samples::findFile(parser.get<std::string>(0));
    img2_filename = samples::findFile(parser.get<std::string>(1));


    // 解析算法参数
    if (parser.has("algorithm"))
    {
        std::string _alg = parser.get<std::string>("algorithm");
        alg = _alg == "bm" ? STEREO_BM :
            _alg == "sgbm" ? STEREO_SGBM :
            _alg == "hh" ? STEREO_HH :
            _alg == "var" ? STEREO_VAR :
            _alg == "hh4" ? STEREO_HH4 :
            _alg == "sgbm3way" ? STEREO_3WAY : -1;
    }
    // 解析其他所有需要的命令行参数
    numberOfDisparities = parser.get<int>("max-disparity");
    SADWindowSize = parser.get<int>("blocksize");
    scale = parser.get<float>("scale");
    no_display = parser.has("no-display");
    color_display = parser.has("color");
    if( parser.has("i") )
        intrinsic_filename = parser.get<std::string>("i");
    if( parser.has("e") )
        extrinsic_filename = parser.get<std::string>("e");
    if( parser.has("o") )
        disparity_filename = parser.get<std::string>("o");
    if( parser.has("p") )
        point_cloud_filename = parser.get<std::string>("p");


    // 检查解析后的参数是否正确
    if (!parser.check())
    {
        parser.printErrors();
        return 1;
    }
    // 检查算法参数是否指定正确
    if( alg < 0 )
    {
        printf("Command-line parameter error: Unknown stereo algorithm\n\n");
        print_help(argv);
        return -1;
    }
    // 检查视差数量设置是否正确
    if ( numberOfDisparities < 1 || numberOfDisparities % 16 != 0 )
    {
        printf("Command-line parameter error: The max disparity (--maxdisparity=<...>) must be a positive integer divisible by 16\n");
        print_help(argv);
        return -1;
    }
    // 检查缩放因子是否正确
    if (scale < 0)
    {
        printf("Command-line parameter error: The scale factor (--scale=<...>) must be a positive floating-point number\n");
        return -1;
    }
    // 检查SAD窗口大小设置是否正确
    if (SADWindowSize < 1 || SADWindowSize % 2 != 1)
    {
        printf("Command-line parameter error: The block size (--blocksize=<...>) must be a positive odd number\n");
        return -1;
    }
    // 检查是否指定了左右图像文件
    if( img1_filename.empty() || img2_filename.empty() )
    {
        printf("Command-line parameter error: both left and right images must be specified\n");
        return -1;
    }
    // 检查内参和外参是否同时指定
    if( (!intrinsic_filename.empty()) ^ (!extrinsic_filename.empty()) )
    {
        printf("Command-line parameter error: either both intrinsic and extrinsic parameters must be specified, or none of them (when the stereo pair is already rectified)\n");
        return -1;
    }
    // 检查生成点云时是否指定了内参和外参
    if( extrinsic_filename.empty() && !point_cloud_filename.empty() )
    {
        printf("Command-line parameter error: extrinsic and intrinsic parameters must be specified to compute the point cloud\n");
        return -1;
    }


    // 根据算法的不同,设置图像的加载模式
    int color_mode = alg == STEREO_BM ? 0 : -1;
    // 加载左右视图图像
    Mat img1 = imread(img1_filename, color_mode);
    Mat img2 = imread(img2_filename, color_mode);


    // 如果左视图图像加载失败,打印错误并退出
    if (img1.empty())
    {
        printf("Command-line parameter error: could not load the first input image file\n");
        return -1;
    }
    // 如果右视图图像加载失败,打印错误并退出
    if (img2.empty())
    {
        printf("Command-line parameter error: could not load the second input image file\n");
        return -1;
    }
    // 如果缩放系数不等于1,则对图像进行缩放
    if (scale != 1.f)
    {
        // 定义两个临时矩阵用于存储缩放后的图像
        Mat temp1, temp2;
        // 根据scale的大小选择合适的插值方法
        int method = scale < 1 ? INTER_AREA : INTER_CUBIC;
        // 对左右图像进行缩放
        resize(img1, temp1, Size(), scale, scale, method);
        img1 = temp1;
        resize(img2, temp2, Size(), scale, scale, method);
        img2 = temp2;
    }
    
    // 获取缩放后的图像大小
    Size img_size = img1.size();
    
    // 定义两个ROI区域以及Q矩阵(用于三维重建)
    Rect roi1, roi2;
    Mat Q;
    
    // 如果内参文件名不为空,则读取内(camera)参和外(stereo)参数
    if( !intrinsic_filename.empty() )
    {
        // 读取内参文件
        FileStorage fs(intrinsic_filename, FileStorage::READ);
        if(!fs.isOpened())
        {
            printf("Failed to open file %s\n", intrinsic_filename.c_str());
            return -1;
        }
    
        // 读取内参矩阵和畸变系数
        Mat M1, D1, M2, D2;
        fs["M1"] >> M1;
        fs["D1"] >> D1;
        fs["M2"] >> M2;
        fs["D2"] >> D2;
    
        // 根据缩放因子调整内参矩阵
        M1 *= scale;
        M2 *= scale;
    
        // 读取外参文件
        fs.open(extrinsic_filename, FileStorage::READ);
        if(!fs.isOpened())
        {
            printf("Failed to open file %s\n", extrinsic_filename.c_str());
            return -1;
        }
    
        // 读取旋转矩阵和平移矩阵
        Mat R, T, R1, P1, R2, P2;
        fs["R"] >> R;
        fs["T"] >> T;
    
        // 对立体图像进行校正
        stereoRectify( M1, D1, M2, D2, img_size, R, T, R1, R2, P1, P2, Q, CALIB_ZERO_DISPARITY, -1, img_size, &roi1, &roi2 );
    
        // 初始化校正映射矩阵
        Mat map11, map12, map21, map22;
        initUndistortRectifyMap(M1, D1, R1, P1, img_size, CV_16SC2, map11, map12);
        initUndistortRectifyMap(M2, D2, R2, P2, img_size, CV_16SC2, map21, map22);
    
        // 应用映射矩阵进行畸变校正和立体校正
        Mat img1r, img2r;
        remap(img1, img1r, map11, map12, INTER_LINEAR);
        remap(img2, img2r, map21, map22, INTER_LINEAR);
    
        // 更新校正后的图像
        img1 = img1r;
        img2 = img2r;
    }
    
    // 计算或更新视差的数量
    numberOfDisparities = numberOfDisparities > 0 ? numberOfDisparities : ((img_size.width/8) + 15) & -16;
    
    // 配置块匹配(Block Matching)算法的参数
    // 设置块匹配算法的区域兴趣(ROI),由roi1和roi2的矩形区域定义。
    bm->setROI1(roi1);
    bm->setROI2(roi2);
    // 设置前置滤波器的上限值用于块匹配算法。
    bm->setPreFilterCap(31);
    // 设置SAD窗口的大小,比较块大小。如果SADWindowSize变量大于0,就使用该变量的值,否则使用默认值9。
    bm->setBlockSize(SADWindowSize > 0 ? SADWindowSize : 9);
    // 设置最小视差,默认为0。
    bm->setMinDisparity(0);
    // 设置视差的数量,这里使用numberOfDisparities变量的值。
    bm->setNumDisparities(numberOfDisparities);
    // 设置纹理阈值,用于过滤掉纹理不够的区域。
    bm->setTextureThreshold(10);
    // 设置唯一性比例,用于判断最佳视差的唯一性。
    bm->setUniquenessRatio(15);
    // 设置视差连通区域变化的窗口大小,这里为100。
    bm->setSpeckleWindowSize(100);
    // 设置视差连通区域的最大视差变化范围,这里为32。
    bm->setSpeckleRange(32);
    // 设置左右视差图的最大差异,超过这个差异的视差值会被剔除。
    bm->setDisp12MaxDiff(1);
   
    
    // 配置半全局块匹配(Semi-Global Block Matching)算法的参数
    // 为半全局块匹配算法设置前置滤波器的上限值。
    sgbm->setPreFilterCap(63);
    // 计算SGBM算法的SAD窗口大小,如果SADWindowSize变量大于0,使用该变量的值,否则使用默认值3。
    int sgbmWinSize = SADWindowSize > 0 ? SADWindowSize : 3;
    // 设置SGBM算法的块大小。
    sgbm->setBlockSize(sgbmWinSize);
    
    // 根据输入图像的通道数计算常数值。
    int cn = img1.channels();
    
    // 设置SGBM算法的P1和P2参数,这些参数控制视差变化的平滑程度。
    sgbm->setP1(8*cn*sgbmWinSize*sgbmWinSize);
    sgbm->setP2(32*cn*sgbmWinSize*sgbmWinSize);
    // 设置最小视差,默认为0。
    sgbm->setMinDisparity(0);
    // 设置视差数量,这里使用numberOfDisparities变量的值。
    sgbm->setNumDisparities(numberOfDisparities);
    // 设置唯一性比例,用于判断最佳视差的唯一性。
    sgbm->setUniquenessRatio(10);
    // 设置视差连通区域变化的窗口大小,这里为100。
    sgbm->setSpeckleWindowSize(100);
    // 设置视差连通区域的最大视差变化范围,这里为32。
    sgbm->setSpeckleRange(32);
    // 设置左右视差图的最大差异,超过这个差异的视差值会被剔除。
    sgbm->setDisp12MaxDiff(1);
    // 根据选择的算法设置SGBM模式。
    if(alg==STEREO_HH)
        sgbm->setMode(StereoSGBM::MODE_HH);
    else if(alg==STEREO_SGBM)
        sgbm->setMode(StereoSGBM::MODE_SGBM);
    else if(alg==STEREO_HH4)
        sgbm->setMode(StereoSGBM::MODE_HH4);
    else if(alg==STEREO_3WAY)
        sgbm->setMode(StereoSGBM::MODE_SGBM_3WAY);
    
    Mat disp, disp8; // 定义存储视差图和转换后的8位视差图的矩阵。
    
    // 获取当前的时间刻度,用于计算视差计算的耗时。
    int64 t = getTickCount();
    float disparity_multiplier = 1.0f; // 定义视差倍数的默认值。
    
    // 根据选定的算法执行视差计算,并根据返回的数据类型设置合适的倍数。
    if( alg == STEREO_BM )
    {
        bm->compute(img1, img2, disp); // 使用BM算法计算视差。
        if (disp.type() == CV_16S)
            disparity_multiplier = 16.0f; // 如果视差图是16位有符号整型,则将倍数设为16。
    }
    else if( alg == STEREO_SGBM || alg == STEREO_HH || alg == STEREO_HH4 || alg == STEREO_3WAY )
    {
        sgbm->compute(img1, img2, disp); // 使用SGBM算法族计算视差。
        if (disp.type() == CV_16S)
            disparity_multiplier = 16.0f; // 如果视差图是16位有符号整型,则将倍数设为16。
    }
    t = getTickCount() - t; // 计算视差计算耗时。
    printf("Time elapsed: %fms\n", t*1000/getTickFrequency()); // 打印耗时信息。
    
    // 将计算出的视差图转换为8位图像以供显示或存储。
    if( alg != STEREO_VAR )
        disp.convertTo(disp8, CV_8U, 255/(numberOfDisparities*16.));
    else
        disp.convertTo(disp8, CV_8U);
    
    Mat disp8_3c; // 定义用于显示彩色视差图的矩阵。
    // 如果选项设置为显示彩色图,则对8位图像应用色彩映射。
    if (color_display)
        cv::applyColorMap(disp8, disp8_3c, COLORMAP_TURBO);
    
    // 如果指定了视差图文件名,则将视差图存储到文件中。
    if(!disparity_filename.empty())
        imwrite(disparity_filename, color_display ? disp8_3c : disp8);
    
    // 如果指定了点云文件名,则保存点云数据到文件中。
    if(!point_cloud_filename.empty())
    {
        printf("storing the point cloud..."); // 打印存储点云数据的信息。
        fflush(stdout);
        Mat xyz; // 定义用于存储3D坐标的矩阵。
        Mat floatDisp; // 定义用于存储转换后的视差图的矩阵。
        // 将视差图转换为浮点型,并应用视差倍数。
        disp.convertTo(floatDisp, CV_32F, 1.0f / disparity_multiplier);
        // 使用Q矩阵将视差图重投影到3D坐标。
        reprojectImageTo3D(floatDisp, xyz, Q, true);
        // 使用saveXYZ函数将3D坐标保存到指定的点云文件中。
        saveXYZ(point_cloud_filename.c_str(), xyz);
        printf("\n"); // 用于换行。
    }
    
    // 如果未设置不显示结果,则创建显示左、右图像和视差图的窗口。
    if( !no_display )
    {
        std::ostringstream oss; // 使用字符串流构建显示的标题。
        oss << "disparity  " << (alg==STEREO_BM ? "bm" :
                                 alg==STEREO_SGBM ? "sgbm" :
                                 alg==STEREO_HH ? "hh" :
                                 alg==STEREO_VAR ? "var" :
                                 alg==STEREO_HH4 ? "hh4" :
                                 alg==STEREO_3WAY ? "sgbm3way" : "");
        oss << "  blocksize:" << (alg==STEREO_BM ? SADWindowSize : sgbmWinSize);
        oss << "  max-disparity:" << numberOfDisparities;
        std::string disp_name = oss.str(); // 从流中获取构建好的标题字符串。
    
        // 创建并显示图像窗口。
        namedWindow("left", cv::WINDOW_NORMAL);
        imshow("left", img1);
        namedWindow("right", cv::WINDOW_NORMAL);
        imshow("right", img2);
        namedWindow(disp_name, cv::WINDOW_AUTOSIZE);
        imshow(disp_name, color_display ? disp8_3c : disp8);
    
        printf("press ESC key or CTRL+C to close..."); // 提示用户如何关闭窗口。
        fflush(stdout);
        printf("\n"); // 用于换行。
        while(1) // 循环等待用户按键操作。
        {
            if(waitKey() == 27) // 如果用户按下ESC键,则退出循环。
                break;
        }
    }
    
    return 0; // 正常结束程序。
}
swift 复制代码
enum { STEREO_BM=0, STEREO_SGBM=1, STEREO_HH=2, STEREO_VAR=3, STEREO_3WAY=4, STEREO_HH4=5 };

什么是视差图

在计算视差图时,遮挡或缺乏纹理的区域会有什么表现?

SGBM算法是如何处理遮挡和纹理缺失问题的?

objectivec 复制代码
stereoRectify( M1, D1, M2, D2, img_size, R, T, R1, R2, P1, P2, Q, CALIB_ZERO_DISPARITY, -1, img_size, &roi1, &roi2 );

这个函数的主要目的是通过计算两个矫正映射,让来自两个摄像头的图像在水平方向上对准,简化立体匹配的复杂性,提高计算效率和质量。正确定位了坐标对齐后,图像中对应的点就可以直接在同一行上进行匹配,使得视差计算更加准确和便捷。

javascript 复制代码
reprojectImageTo3D(floatDisp, xyz, Q, true);

这个函数中的投影变换矩阵Q是如何计算得到的?

The End

相关推荐
m0_7431064643 分钟前
【论文笔记】MV-DUSt3R+:两秒重建一个3D场景
论文阅读·深度学习·计算机视觉·3d·几何学
m0_743106461 小时前
【论文笔记】TranSplat:深度refine的camera-required可泛化稀疏方法
论文阅读·深度学习·计算机视觉·3d·几何学
井底哇哇4 小时前
ChatGPT是强人工智能吗?
人工智能·chatgpt
Coovally AI模型快速验证4 小时前
MMYOLO:打破单一模式限制,多模态目标检测的革命性突破!
人工智能·算法·yolo·目标检测·机器学习·计算机视觉·目标跟踪
AI浩4 小时前
【面试总结】FFN(前馈神经网络)在Transformer模型中先升维再降维的原因
人工智能·深度学习·计算机视觉·transformer
可为测控4 小时前
图像处理基础(4):高斯滤波器详解
人工智能·算法·计算机视觉
一水鉴天5 小时前
为AI聊天工具添加一个知识系统 之63 详细设计 之4:AI操作系统 之2 智能合约
开发语言·人工智能·python
倔强的石头1065 小时前
解锁辅助驾驶新境界:基于昇腾 AI 异构计算架构 CANN 的应用探秘
人工智能·架构
佛州小李哥6 小时前
Agent群舞,在亚马逊云科技搭建数字营销多代理(Multi-Agent)(下篇)
人工智能·科技·ai·语言模型·云计算·aws·亚马逊云科技
说私域6 小时前
社群裂变+2+1链动新纪元:S2B2C小程序如何重塑企业客户管理版图?
大数据·人工智能·小程序·开源