OpenCV8-图像金字塔

OpenCV8-图像金字塔


1.图像金字塔

图像"金字塔"是通过多个分辨率表示图像的一种有效且简单的结构。一个图像"金字塔"是一系列以金字塔形状排列、分辨率逐步降低的图像集合。图像"金字塔"的底部是待处理图像的高分辨率表示,顶部是低分辨率表示。本文中将介绍图像"金字塔"中比较著名的两种:高斯"金字塔"和拉普拉斯"金字塔"。

2.高斯金字塔

高斯"金字塔"是指通过下采样不断地将图像的尺寸缩小,进而在图像"金字塔"中包含多个尺寸的图像。一般情况下,高斯"金字塔"的底层为图像的原图,每往上一层就会通过下采样缩小一次图像的尺寸,通常情况下,尺寸会缩小为原来的一半,但是如果有特俗需求,缩小的尺寸也可以根据实际情况进行调整。由于每次图像的尺寸都缩小为原来的一半,图像尺寸缩小的速度非常快,因此常见的高斯"金字塔"的层数为3~6层。

OpenCV中提供了pyrDown函数专门用于图像的下采样计算,以便构建图像的高斯"金字塔":

cpp 复制代码
void pyrDown(
    InputArray src,  // 输入待下采样的图像
    OutputArray dst, // 输出下采样后的图像
    const Size& dstsize = Size(),  // 输出图像尺寸,可以默认
    int borderType = BORDER_DEFAULT // 像素边界外推方法的标志,图像几何变换一文中-仿射变换有说明
);

该函数用于实现图像模糊并对其进行下采样,默认标志下,函数输出图像的尺寸为输入图像尺寸的一半,但是也可以通过dstsize参数来设置输出图像的大小,需要注意的是,无论输出尺寸为多少,应该满足下面公式的条件:
{ ∣ d s t s i z e . w i d t h 2 − s r c . c o l s ∣ ≤ 2 ∣ d s t s i z e . h e i g h t 2 − s r c . r o l s ∣ ≤ 2 \left\{ \begin{matrix} | dstsize.width2 - src.cols | \leq 2 \\ | dstsize.height2 - src.rols | \leq 2 \\ \end{matrix} \right. {∣dstsize.width2−src.cols∣≤2∣dstsize.height2−src.rols∣≤2

该函数首先将原始图像与内核矩阵进行卷积,之后通过不适用偶数行和列的方式对图像进行下采样,最终实现尺寸缩小的下采样,内核矩阵如下:
k = 1 256 [ 1 4 6 4 1 4 6 24 6 4 6 24 36 24 6 4 16 24 16 4 1 4 6 4 1 ] k = \frac{1}{256} \begin{bmatrix} 1 & 4 & 6 & 4 & 1 \\ 4 & 6 & 24 & 6 & 4 \\ 6 & 24 & 36 & 24 & 6 \\ 4 & 16 & 24 & 16 & 4 \\ 1 & 4 & 6 & 4 & 1 \\ \end{bmatrix} k=2561 14641462416462436246462416414641

该函数的功能与resize函数将图像尺寸缩小一样,但是使用的内部算法不同。

3.拉普拉斯金字塔

拉普拉斯"金字塔"是通过上层小尺寸的图像构建下层大尺寸的图像。拉普拉斯"金字塔"具有预测残差的作用,需要与高斯"金字塔"一起使用。

假设我们有了一个高斯图像"金字塔",对于其中的第i层图像(高斯"金字塔"最下面为第0层),首先通过下采样得到一个尺寸缩小一半图像,即高斯"金字塔"中的第i+1层或者不在高斯"金字塔"中,之后对这福图像进行上采样,将图像尺寸恢复到第i层图像的大小,最后求取高斯"金字塔"第i层图像与经过上采样后的图像的残差图像,这个残差图像就是拉普拉斯"金字塔"的第i层图像。

对于上采样操作OpenCV提供了pyrUp函数:

cpp 复制代码
void pyrUp(
    InputArray src, 
    OutputArray dst,
    const Size& dstsize = Size(), 
    int borderType = BORDER_DEFAULT 
);
// 函数参数同pyrDown

4.Demo

cpp 复制代码
#include <opencv2\opencv.hpp>
#include <opencv2/core/utils/logger.hpp> // debug no log
#include <iostream>
using namespace cv;
using namespace std;

int main()
{
	cout << "OpenCV Version: " << CV_VERSION << endl;
	utils::logging::setLogLevel(utils::logging::LOG_LEVEL_SILENT);

	Mat img = imread("lena.png");
	if (img.empty())
	{
		cout << "请确认图像文件名称是否正确" << endl;
		return -1;
	}
	vector<Mat> Gauss, Lap;  //高斯金字塔和拉普拉斯金字塔
	int level = 3;  //高斯金字塔下采样次数
	Gauss.push_back(img);  //将原图作为高斯金字塔的第0层
	//构建高斯金字塔
	for (int i = 0; i < level; i++)
	{
		Mat gauss;
		pyrDown(Gauss[i], gauss);  //下采样
		Gauss.push_back(gauss);
	}
	//构建拉普拉斯金字塔
	for (int i = Gauss.size() - 1; i > 0; i--)
	{
		Mat lap, upGauss;
		if (i == Gauss.size() - 1)  //如果是高斯金字塔中的最上面一层图像
		{
			Mat down;
			pyrDown(Gauss[i], down);  //上采样
			pyrUp(down, upGauss);
			lap = Gauss[i] - upGauss;
			Lap.push_back(lap);
		}
		pyrUp(Gauss[i], upGauss);
		lap = Gauss[i - 1] - upGauss;
		Lap.push_back(lap);
	}
	//查看两个金字塔中的图像
	for (int i = 0; i < Gauss.size(); i++)
	{
		string name = to_string(i);
		imshow("G" + name, Gauss[i]);
		imshow("L" + name, Lap[i]);
	}

	waitKey(0);
	return 0;
}
相关推荐
美狐美颜sdk13 分钟前
从源码到平台:基于第三方视频美颜SDK开发实时直播美颜系统
深度学习·计算机视觉·音视频·直播美颜sdk·视频美颜sdk·美颜api·主播美颜插件
TANGLONG22234 分钟前
【初阶数据结构和算法】leetcode刷题之设计循环队列
java·c语言·数据结构·c++·python·算法·leetcode
OTWOL41 分钟前
零基础学指针(下)
c语言·c++
bigbig猩猩42 分钟前
C/C++链接数据库(MySQL)超级详细指南
c语言·数据库·c++
小志biubiu1 小时前
【C++11】可变参数模板/新的类功能/lambda/包装器--C++
开发语言·c++·笔记·学习·c++11·c11
羑悻的小杀马特1 小时前
位图与布隆过滤器
数据结构·c++·位图·布隆过滤器
只怕自己不够好1 小时前
OpenCV 图像轮廓查找与绘制全攻略:从函数使用到实战应用详解
人工智能·opencv·计算机视觉
是店小二呀1 小时前
【C++】C++11新特性详解:可变参数模板与emplace系列的应用
android·c++
小厂程序猿1 小时前
opencv读写文件操作
人工智能·opencv·计算机视觉
想成为高手4992 小时前
深入理解二叉搜索树(BST)
数据结构·c++·算法