【计算机视觉系列实战教程 (十四)】:图像金字塔(高斯金字塔、拉普拉斯金字塔)

1.图像金字塔

(1)下采样

从G0 -> G1、G2、G3

  • step01:对图像Gi进行高斯核卷积操作(高斯滤波)
  • step02:删除所有的偶数行和列
cpp 复制代码
void cv::pyrDown(
	cv::Mat &imSrc, //输入图像
	cv::Mat &imDst, //下采样后的输出图像
	cv::Size size = cv::Size(), //imDst的尺寸,默认是输入图像的1、2
	int borderType=4 //一般默认即可
	);

(2)上采样

从G3 -> G2、G1、G0

  • step01:将图像在每个方向上扩大为原图像的2倍,新增的行和列均用0来填充
  • step02:使用与"向下取样"相同的卷积核乘以4,再与放大后的图像进行卷积运算
cpp 复制代码
void cv::pyrUp(
	cv::Mat &imSrc,
	cv::Mat &imDst,
	cv::Size size=cv::Size(), //默认位imSrc的2
	int borderType = 4
	);

2.高斯金字塔

(1)原理

高斯金字塔的构建就是迭代地对图像进行下采样,下采样的步骤如1中下采样的介绍

(2)How(如何构建高斯金字塔)

构建高斯金字塔函数如下(可直接使用):

cpp 复制代码
/* @author @还下着雨ZG
 * @brief 根据传入的图像构建它的高斯金字塔
 * @param[in] imSrc, 输入的源图像
 * @param[out] vPyrGaussian, 输出的图像金字塔
 * @param[in] iLayer, 金字塔的层数
 * @return int, 正数表示金字塔构建成功,负数表示金字塔构建失败
*/
int GetPyrGaussian(const cv::Mat &imSrc, std::vector<cv::Mat>& vPyrGaussian,int iLayer)
{
    if (imSrc.empty())
        return -1;
    if (!vPyrGaussian.empty())
    {
        vPyrGaussian.clear();
    }
    if (iLayer <= 0)
        return -2;
    //下采样
    vPyrGaussian.resize(iLayer);
    cv::Mat imTmp;
    for (int i = 0; i < iLayer; ++i)
    {
        if (i == 0)
            vPyrGaussian[i] = imSrc;
        else {
            cv::pyrDown(vPyrGaussian[i-1], imTmp);
            vPyrGaussian[i] = imTmp;
        }
    }
    return 1;
}

3拉普拉斯图像金字塔

(1)What(什么是拉普拉斯图)

拉普拉斯图是基于高斯图的,拉普拉斯图的本质是残差,即第i层的高斯图 - 先缩小后放大的图;不明白可直接看下面构建拉普拉斯图像金字塔函数。

(2)How(如何构建拉普拉斯图像金字塔)

构建拉普拉是图像金字塔,可直接使用:

cpp 复制代码
/* @author @还下着雨ZG
 * @brief 基于高斯金字塔构建拉普拉斯金字塔
 * @param[in] vPyrGaussian, 输入的高斯图像金字塔
 * @param[out] vPyrLaplacian, 输出的拉普拉斯图像金字塔
 * @return int, 正数表示金字塔构建成功,负数表示金字塔构建失败
*/
int GetPyrLaplacian(const std::vector<cv::Mat>& vPyrGaussian,std::vector<cv::Mat>& vPyrLaplacian)
{
    /*对输入参数及其约束关系进行检查*/
    if (vPyrGaussian.empty())
        return -1;
    if (!vPyrLaplacian.empty())
        vPyrLaplacian.clear();

    /*构建拉普拉斯金字塔*/
    cv::Mat imLplTmp;
    for (int i = 0; i < vPyrGaussian.size()-1; ++i)
    {
        cv::Mat imTmp(vPyrGaussian[i].size(), vPyrGaussian[i].type());
        cv::pyrUp(vPyrGaussian[i + 1], imTmp);
        imLplTmp = vPyrGaussian[i] - imTmp;
        vPyrLaplacian.push_back(imLplTmp);
    }
    return 1;
}

(3)使用opencv自带的函数获取拉普拉斯图像

cpp 复制代码
void cv::Laplacian(
	cv::Mat &imSrc, //输入图像
	cv::Mat &imLpl, //输出的拉普拉斯图像
	int ddepth, //imLpl的数据格式
	int ksize =1, 
	double scale=1, //拉普拉斯值的缩放值
	double delta = 0, //偏置值
	int borderType = BORDER_DEFAULT
	);

(4)使用拉普拉斯金字塔恢复原图

cpp 复制代码
cv::Mat imRead = cv::imread(strPth01);
std::vector<cv::Mat> vPyrGaussian;
std::vector<cv::Mat> vPyrLaplacian;
int iFlagGssn = GetPyrGaussian(imRead, vPyrGaussian, 3);
if (iFlagGssn < 0) return;
int iFlagLpl = GetPyrLaplacian(vPyrGaussian, vPyrLaplacian);

//利用拉普拉斯金字塔图进行图像复原
cv::Mat imMin = vPyrGaussian[vPyrGaussian.size() - 1];
for (int i = 0; i < vPyrLaplacian.size(); ++i)
{
	if (i == 0)
	{
		cv::pyrUp(imMin, imMin);
		imMin += vPyrLaplacian[vPyrLaplacian.size() - 1 - i];
	}
	else
	{
		cv::pyrUp(imMin, imMin);
		imMin += vPyrLaplacian[vPyrLaplacian.size() - 1 - i];
	}

}
相关推荐
BagMM18 分钟前
DetLH论文阅读
人工智能·计算机视觉·目标跟踪
fundroid30 分钟前
Androidify:谷歌官方 AI + Android 开源示例应用
android·人工智能·开源
居然JuRan40 分钟前
大模型瘦身术:量化与蒸馏技术全解析
人工智能
艾莉丝努力练剑41 分钟前
【优选算法必刷100题】第031~32题(前缀和算法):连续数组、矩阵区域和
大数据·人工智能·线性代数·算法·矩阵·二维前缀和
不去幼儿园1 小时前
【启发式算法】灰狼优化算法(Grey Wolf Optimizer, GWO)详细介绍(Python)
人工智能·python·算法·机器学习·启发式算法
remaindertime1 小时前
基于Ollama和Spring AI:实现本地大模型对话与 RAG 功能
人工智能·后端·ai编程
y***54881 小时前
Vue语音识别开发
人工智能·语音识别
sdjnled2291 小时前
山东裸眼3D立体LED显示屏专业服务商
人工智能·3d
徒慕风流1 小时前
GeoSight:基于 Open3D 与 PySide6 的参数化 3D 模型处理与实时点云监控工具
计算机视觉·3d·信号处理
忘却的旋律dw2 小时前
使用LLM模型的tokenizer报错AttributeError: ‘dict‘ object has no attribute ‘model_type‘
人工智能·pytorch·python