OpenCV-38 图像金字塔

目录

一、图像金字塔

[1. 高斯金字塔](#1. 高斯金字塔)

[2. 拉普拉斯金字塔](#2. 拉普拉斯金字塔)


一、图像金字塔

图像金字塔是图像中多尺度表达的一种,最主要用于图像的分割 ,是一种以多分辨率来解释图像的有效但概念简单的结构。简单来说,图像金字塔是同一图像不同分辨率的子图集合

图像金字塔最初用于机器视觉和图像压缩,一幅图像的金字塔是一系列以金字塔状排列的分辨率逐步降低 ,且来源于同一张原始图的图像集合。其通过梯次向下采样获得,直到达到某个终止条件才停止采样金字塔的底部是待处理图像的高分辨率表示,而顶部是低分辨率的近似。我们将一层一层的图像比喻成金字塔,层级越高,则图像越小,分辨率越低。

目前有两类常用的图像金字塔

高斯金字塔(Gaussian pyramid):用于向下/降采样(向下不是方向向下,而是指的是分辨率减小),是主要的图像金字塔

拉普拉斯金字塔(Laplacian pyramid):用于从金字塔底层图像重建上层未采样图像,在数字图像处理中也即是预测残差,可以对图像进行最大程度的还原,配合高斯金字塔一起使用

1. 高斯金字塔

高斯金字塔是通过高斯平滑 和**亚采样(subsampling)**获得一系列下采样的图像。

原理如下:

GI指图像

原始图像 M * N -> 处理后图像 M/2 * N/2(奇数也可以进行,系统会自动进行类似于四舍五入的操作)

每次处理后,结果图像时原来的1/4

注意:

向下采样会丢失图像的信息

向上采样与向下采样操作相反

  1. 将图像在每个方向扩大为原来的两倍,新增的行和列以0补充。

  2. 使用先前同样的内核(乘以4)与放大后的图像卷积。获得近似值。

pyrDown(img)--- 向下采样

pyrUp(img)--- 向上采样

示例代码如下:

复制代码
import cv2
import numpy as np
lena = cv2.imread("beautiful women.png")
print(lena.shape)
# 分辨率减小,下采样
new_1 = cv2.pyrDown(lena)
new_2 = cv2.pyrDown(new_1)
print(new_1.shape)
cv2.imshow("img", lena)
cv2.imshow("img1", new_1)
cv2.imshow("img2", new_2)
# 分辨率增大,上采样
new_3 = cv2.pyrUp(lena)
cv2.imshow("img3", new_3)
cv2.waitKey(0)
cv2.destroyAllWindows()

输出结果如下:

2. 拉普拉斯金字塔

拉普拉斯金字塔没有特定的函数,只是用数学公式进行推导得到的。

将降采样之后的图像在进行上采样操作,与原图进行做差得到残差图。 为还原图像做信息准备。

即拉普拉斯金字塔最终得到的是残差。

拉普拉斯金字塔由高斯金字塔构成,没有专门的函数。

拉普拉斯金字塔图像类似图像边缘,它的大部分元素都是0, 用于图像压缩。

示例代码如下:

复制代码
import cv2
lena = cv2.imread("beautiful women.png")
# 计算第0层的拉普拉斯金字塔
# 先缩小再放大
dst = cv2.pyrDown(lena)
# 分辨率增大,上采样
dst = cv2.pyrUp(dst)
dst.resize((634, 627, 3))
print(dst.shape)
print(lena.shape)
lap0 = lena - dst
cv2.imshow("img", lap0)
#  计算第1层的拉普拉斯金字塔
dst1 = cv2.pyrDown(dst)
dst1 = cv2.pyrUp(dst1)
dst1.resize((634, 627, 3))
lap1 = dst - dst1
cv2.imshow("img1", lap1)
cv2.waitKey(0)
cv2.destroyAllWindows()

输出结果如下:

第0层拉普拉斯金字塔:

第1层拉普拉斯金字塔:

相关推荐
100个铜锣烧2 小时前
高级提示技术:Chain-of-Thought与ReAct——让大模型学会“思考”和“行动”
人工智能·大模型·提示词工程
JackHCC2 小时前
快手OneRetrieval:可编辑生成式电商召回
人工智能·机器学习
hhzz2 小时前
基于监控视频的水位尺自动识别技术方案与实现
python·opencv·yolo·图像识别·cv
yongche_shi2 小时前
ragas官方文档中文版(五十)
开发语言·python·ai·ragas·如何评估和改进 rag 应用
前端之虎陈随易2 小时前
编程语言级别的Skill市场,AI Agent 的未来形态
前端·vue.js·人工智能·typescript·node.js
QiLinkOS3 小时前
第三视觉理解徐玉生与他的商业活动(30)
大数据·c++·人工智能·算法·开源协议
武汉唯众智创3 小时前
当汉字成为心理CT:AI汉字联想投射分析的技术实现与心理评估价值
人工智能·ai心理健康·ai心理评估·本土化心理测评·校园心理健康解决方案·ai心理监测·多模态情绪模型
Longvox3 小时前
Agent为什么会死循环?
人工智能·ai编程
陈天伟教授3 小时前
FreeCAD 启动后小窗口闪现即退的解决思路
人工智能·机器人·工业设计
weixin_408099673 小时前
OCR批量识别图片方案:从手动处理到自动化API系统(Python/Java/PHP实战)
图像处理·python·ocr·文字识别·api调用·批量识别·石榴智能