【计算机视觉系列实战教程 (十四)】:图像金字塔(高斯金字塔、拉普拉斯金字塔)

1.图像金字塔

(1)下采样

从G0 -> G1、G2、G3

  • step01:对图像Gi进行高斯核卷积操作(高斯滤波)
  • step02:删除所有的偶数行和列
cpp 复制代码
void cv::pyrDown(
	cv::Mat &imSrc, //输入图像
	cv::Mat &imDst, //下采样后的输出图像
	cv::Size size = cv::Size(), //imDst的尺寸,默认是输入图像的1、2
	int borderType=4 //一般默认即可
	);

(2)上采样

从G3 -> G2、G1、G0

  • step01:将图像在每个方向上扩大为原图像的2倍,新增的行和列均用0来填充
  • step02:使用与"向下取样"相同的卷积核乘以4,再与放大后的图像进行卷积运算
cpp 复制代码
void cv::pyrUp(
	cv::Mat &imSrc,
	cv::Mat &imDst,
	cv::Size size=cv::Size(), //默认位imSrc的2
	int borderType = 4
	);

2.高斯金字塔

(1)原理

高斯金字塔的构建就是迭代地对图像进行下采样,下采样的步骤如1中下采样的介绍

(2)How(如何构建高斯金字塔)

构建高斯金字塔函数如下(可直接使用):

cpp 复制代码
/* @author @还下着雨ZG
 * @brief 根据传入的图像构建它的高斯金字塔
 * @param[in] imSrc, 输入的源图像
 * @param[out] vPyrGaussian, 输出的图像金字塔
 * @param[in] iLayer, 金字塔的层数
 * @return int, 正数表示金字塔构建成功,负数表示金字塔构建失败
*/
int GetPyrGaussian(const cv::Mat &imSrc, std::vector<cv::Mat>& vPyrGaussian,int iLayer)
{
    if (imSrc.empty())
        return -1;
    if (!vPyrGaussian.empty())
    {
        vPyrGaussian.clear();
    }
    if (iLayer <= 0)
        return -2;
    //下采样
    vPyrGaussian.resize(iLayer);
    cv::Mat imTmp;
    for (int i = 0; i < iLayer; ++i)
    {
        if (i == 0)
            vPyrGaussian[i] = imSrc;
        else {
            cv::pyrDown(vPyrGaussian[i-1], imTmp);
            vPyrGaussian[i] = imTmp;
        }
    }
    return 1;
}

3拉普拉斯图像金字塔

(1)What(什么是拉普拉斯图)

拉普拉斯图是基于高斯图的,拉普拉斯图的本质是残差,即第i层的高斯图 - 先缩小后放大的图;不明白可直接看下面构建拉普拉斯图像金字塔函数。

(2)How(如何构建拉普拉斯图像金字塔)

构建拉普拉是图像金字塔,可直接使用:

cpp 复制代码
/* @author @还下着雨ZG
 * @brief 基于高斯金字塔构建拉普拉斯金字塔
 * @param[in] vPyrGaussian, 输入的高斯图像金字塔
 * @param[out] vPyrLaplacian, 输出的拉普拉斯图像金字塔
 * @return int, 正数表示金字塔构建成功,负数表示金字塔构建失败
*/
int GetPyrLaplacian(const std::vector<cv::Mat>& vPyrGaussian,std::vector<cv::Mat>& vPyrLaplacian)
{
    /*对输入参数及其约束关系进行检查*/
    if (vPyrGaussian.empty())
        return -1;
    if (!vPyrLaplacian.empty())
        vPyrLaplacian.clear();

    /*构建拉普拉斯金字塔*/
    cv::Mat imLplTmp;
    for (int i = 0; i < vPyrGaussian.size()-1; ++i)
    {
        cv::Mat imTmp(vPyrGaussian[i].size(), vPyrGaussian[i].type());
        cv::pyrUp(vPyrGaussian[i + 1], imTmp);
        imLplTmp = vPyrGaussian[i] - imTmp;
        vPyrLaplacian.push_back(imLplTmp);
    }
    return 1;
}

(3)使用opencv自带的函数获取拉普拉斯图像

cpp 复制代码
void cv::Laplacian(
	cv::Mat &imSrc, //输入图像
	cv::Mat &imLpl, //输出的拉普拉斯图像
	int ddepth, //imLpl的数据格式
	int ksize =1, 
	double scale=1, //拉普拉斯值的缩放值
	double delta = 0, //偏置值
	int borderType = BORDER_DEFAULT
	);

(4)使用拉普拉斯金字塔恢复原图

cpp 复制代码
cv::Mat imRead = cv::imread(strPth01);
std::vector<cv::Mat> vPyrGaussian;
std::vector<cv::Mat> vPyrLaplacian;
int iFlagGssn = GetPyrGaussian(imRead, vPyrGaussian, 3);
if (iFlagGssn < 0) return;
int iFlagLpl = GetPyrLaplacian(vPyrGaussian, vPyrLaplacian);

//利用拉普拉斯金字塔图进行图像复原
cv::Mat imMin = vPyrGaussian[vPyrGaussian.size() - 1];
for (int i = 0; i < vPyrLaplacian.size(); ++i)
{
	if (i == 0)
	{
		cv::pyrUp(imMin, imMin);
		imMin += vPyrLaplacian[vPyrLaplacian.size() - 1 - i];
	}
	else
	{
		cv::pyrUp(imMin, imMin);
		imMin += vPyrLaplacian[vPyrLaplacian.size() - 1 - i];
	}

}
相关推荐
Elastic 中国社区官方博客21 分钟前
使用 Elasticsearch 导航检索增强生成图表
大数据·数据库·人工智能·elasticsearch·搜索引擎·ai·全文检索
云天徽上1 小时前
【数据可视化】全国星巴克门店可视化
人工智能·机器学习·信息可视化·数据挖掘·数据分析
大嘴吧Lucy1 小时前
大模型 | AI驱动的数据分析:利用自然语言实现数据查询到可视化呈现
人工智能·信息可视化·数据分析
AI技术控1 小时前
计算机视觉算法实战——无人机检测
算法·计算机视觉·无人机
艾思科蓝 AiScholar1 小时前
【连续多届EI稳定收录&出版级别高&高录用快检索】第五届机械设计与仿真国际学术会议(MDS 2025)
人工智能·数学建模·自然语言处理·系统架构·机器人·软件工程·拓扑学
watersink2 小时前
面试题库笔记
大数据·人工智能·机器学习
Yuleave2 小时前
PaSa:基于大语言模型的综合学术论文搜索智能体
人工智能·语言模型·自然语言处理
数字化综合解决方案提供商2 小时前
【Rate Limiting Advanced插件】赋能AI资源高效分配
大数据·人工智能
一只码代码的章鱼2 小时前
机器学习2 (笔记)(朴素贝叶斯,集成学习,KNN和matlab运用)
人工智能·机器学习
周杰伦_Jay3 小时前
简洁明了:介绍大模型的基本概念(大模型和小模型、模型分类、发展历程、泛化和微调)
人工智能·算法·机器学习·生成对抗网络·分类·数据挖掘·transformer