【计算机视觉系列实战教程 (十四)】:图像金字塔(高斯金字塔、拉普拉斯金字塔)

1.图像金字塔

(1)下采样

从G0 -> G1、G2、G3

  • step01:对图像Gi进行高斯核卷积操作(高斯滤波)
  • step02:删除所有的偶数行和列
cpp 复制代码
void cv::pyrDown(
	cv::Mat &imSrc, //输入图像
	cv::Mat &imDst, //下采样后的输出图像
	cv::Size size = cv::Size(), //imDst的尺寸,默认是输入图像的1、2
	int borderType=4 //一般默认即可
	);

(2)上采样

从G3 -> G2、G1、G0

  • step01:将图像在每个方向上扩大为原图像的2倍,新增的行和列均用0来填充
  • step02:使用与"向下取样"相同的卷积核乘以4,再与放大后的图像进行卷积运算
cpp 复制代码
void cv::pyrUp(
	cv::Mat &imSrc,
	cv::Mat &imDst,
	cv::Size size=cv::Size(), //默认位imSrc的2
	int borderType = 4
	);

2.高斯金字塔

(1)原理

高斯金字塔的构建就是迭代地对图像进行下采样,下采样的步骤如1中下采样的介绍

(2)How(如何构建高斯金字塔)

构建高斯金字塔函数如下(可直接使用):

cpp 复制代码
/* @author @还下着雨ZG
 * @brief 根据传入的图像构建它的高斯金字塔
 * @param[in] imSrc, 输入的源图像
 * @param[out] vPyrGaussian, 输出的图像金字塔
 * @param[in] iLayer, 金字塔的层数
 * @return int, 正数表示金字塔构建成功,负数表示金字塔构建失败
*/
int GetPyrGaussian(const cv::Mat &imSrc, std::vector<cv::Mat>& vPyrGaussian,int iLayer)
{
    if (imSrc.empty())
        return -1;
    if (!vPyrGaussian.empty())
    {
        vPyrGaussian.clear();
    }
    if (iLayer <= 0)
        return -2;
    //下采样
    vPyrGaussian.resize(iLayer);
    cv::Mat imTmp;
    for (int i = 0; i < iLayer; ++i)
    {
        if (i == 0)
            vPyrGaussian[i] = imSrc;
        else {
            cv::pyrDown(vPyrGaussian[i-1], imTmp);
            vPyrGaussian[i] = imTmp;
        }
    }
    return 1;
}

3拉普拉斯图像金字塔

(1)What(什么是拉普拉斯图)

拉普拉斯图是基于高斯图的,拉普拉斯图的本质是残差,即第i层的高斯图 - 先缩小后放大的图;不明白可直接看下面构建拉普拉斯图像金字塔函数。

(2)How(如何构建拉普拉斯图像金字塔)

构建拉普拉是图像金字塔,可直接使用:

cpp 复制代码
/* @author @还下着雨ZG
 * @brief 基于高斯金字塔构建拉普拉斯金字塔
 * @param[in] vPyrGaussian, 输入的高斯图像金字塔
 * @param[out] vPyrLaplacian, 输出的拉普拉斯图像金字塔
 * @return int, 正数表示金字塔构建成功,负数表示金字塔构建失败
*/
int GetPyrLaplacian(const std::vector<cv::Mat>& vPyrGaussian,std::vector<cv::Mat>& vPyrLaplacian)
{
    /*对输入参数及其约束关系进行检查*/
    if (vPyrGaussian.empty())
        return -1;
    if (!vPyrLaplacian.empty())
        vPyrLaplacian.clear();

    /*构建拉普拉斯金字塔*/
    cv::Mat imLplTmp;
    for (int i = 0; i < vPyrGaussian.size()-1; ++i)
    {
        cv::Mat imTmp(vPyrGaussian[i].size(), vPyrGaussian[i].type());
        cv::pyrUp(vPyrGaussian[i + 1], imTmp);
        imLplTmp = vPyrGaussian[i] - imTmp;
        vPyrLaplacian.push_back(imLplTmp);
    }
    return 1;
}

(3)使用opencv自带的函数获取拉普拉斯图像

cpp 复制代码
void cv::Laplacian(
	cv::Mat &imSrc, //输入图像
	cv::Mat &imLpl, //输出的拉普拉斯图像
	int ddepth, //imLpl的数据格式
	int ksize =1, 
	double scale=1, //拉普拉斯值的缩放值
	double delta = 0, //偏置值
	int borderType = BORDER_DEFAULT
	);

(4)使用拉普拉斯金字塔恢复原图

cpp 复制代码
cv::Mat imRead = cv::imread(strPth01);
std::vector<cv::Mat> vPyrGaussian;
std::vector<cv::Mat> vPyrLaplacian;
int iFlagGssn = GetPyrGaussian(imRead, vPyrGaussian, 3);
if (iFlagGssn < 0) return;
int iFlagLpl = GetPyrLaplacian(vPyrGaussian, vPyrLaplacian);

//利用拉普拉斯金字塔图进行图像复原
cv::Mat imMin = vPyrGaussian[vPyrGaussian.size() - 1];
for (int i = 0; i < vPyrLaplacian.size(); ++i)
{
	if (i == 0)
	{
		cv::pyrUp(imMin, imMin);
		imMin += vPyrLaplacian[vPyrLaplacian.size() - 1 - i];
	}
	else
	{
		cv::pyrUp(imMin, imMin);
		imMin += vPyrLaplacian[vPyrLaplacian.size() - 1 - i];
	}

}
相关推荐
智算菩萨8 小时前
国内外最新AI语言模型行情分析2025年9月最新内容
人工智能
ningmengjing_8 小时前
激活函数:神经网络的“灵魂开关”
人工智能·深度学习·神经网络
Billy_Zuo8 小时前
人工智能机器学习——逻辑回归
人工智能·机器学习·逻辑回归
东风西巷9 小时前
Balabolka:免费高效的文字转语音软件
前端·人工智能·学习·语音识别·软件需求
非门由也9 小时前
《sklearn机器学习——管道和复合估计器》联合特征(FeatureUnion)
人工智能·机器学习·sklearn
l12345sy9 小时前
Day21_【机器学习—决策树(1)—信息增益、信息增益率、基尼系数】
人工智能·决策树·机器学习·信息增益·信息增益率·基尼指数
非门由也9 小时前
《sklearn机器学习——管道和复合估算器》异构数据的列转换器
人工智能·机器学习·sklearn
计算机毕业设计指导9 小时前
基于ResNet50的智能垃圾分类系统
人工智能·分类·数据挖掘
飞哥数智坊9 小时前
终端里用 Claude Code 太难受?我把它接进 TRAE,真香!
人工智能·claude·trae
小王爱学人工智能10 小时前
OpenCV的阈值处理
人工智能·opencv·计算机视觉