opencv学习(图像金字塔)

1.什么是图像金字塔

图像金字塔是一种多尺度图像表示方法 ,通过对原始图像进行下采样 (缩小)和上采样(放大),生成一系列不同分辨率的图像集合,形似 "金字塔"(底部是高分辨率原始图像,向上逐渐变为低分辨率图像)。

2.核心作用

多尺度分析:不同分辨率的图像适用于检测不同大小的目标(如大目标在低分辨率图像中更易识别,小目标需要高分辨率)。

图像融合:结合不同尺度的图像信息(如拉普拉斯金字塔可无缝融合两张图像的细节)。

降维与压缩:低分辨率图像数据量小,便于快速处理和存储。

特征提取:在多个尺度上提取特征(如 SIFT 特征依赖金字塔实现尺度不变性)。

3.常见的2种操作方法

高斯金字塔,拉普拉斯金字塔

(1)高斯金字塔

是最常见的类型,通过下采样上采样操作生成,核心是高斯模糊(平滑)和降采样。

下采样(缩小图像):cv2.pyrDown()

上采样(放大图像):cv2.pyrUp()

如代码示例:

python 复制代码
img=cv2.imread('aiye.jpg')
def cv_show(name,img):
    cv2.imshow(name,img)
    cv2.waitKey(0)
    cv2.destroyAllWindows()
cv_show('aiye',img)
print(img.shape)
#高斯金字塔(向下采样(图像缩小),向上采样(图像放大,矩阵添0))

up1=cv2.pyrUp(img)
cv_show('up1',up1)
print(up1.shape)

down1=cv2.pyrDown(img)
cv_show('down1',down1)
print(down1.shape)

'''
先执行上采样再执行下采样,或者先下后上都是无法恢复到原图的
'''
(2)拉普拉斯金字塔

基于高斯金字塔构建,用于保留图像下采样过程中丢失的细节,核心是 "原始图像与上采样后的下采样图像的差值"。

计算方式

公式:Li​=Gi​−pyrUp(pyrDown(Gi)​)

如代码示例:

python 复制代码
up2=cv2.pyrUp(down1)
'''
img 和 up2 的尺寸不同(一个是 (299,299,3),另一个是 (300,300,3)),无法进行减法运算(lap=img-up2),
则先让两个图像的尺寸大小一致了再进行减法。要么改img要么改up2
'''
up2_rs=cv2.resize(up2,(img.shape[1],img.shape[0]))
lap=img-up2_rs
cv_show('lap',lap)
print(lap.shape)
相关推荐
余俊晖16 小时前
多页文档理解强化学习设计思路:DocR1奖励函数设计与数据构建思路
人工智能·语言模型·自然语言处理
Yeats_Liao16 小时前
MindSpore开发之路(二十六):系列总结与学习路径展望
人工智能·深度学习·学习·机器学习
sinat_2869451916 小时前
opencode
人工智能·算法·chatgpt
gorgeous(๑>؂<๑)16 小时前
【中科院-张启超组-AAAI26】WorldRFT: 用于自动驾驶的带强化微调的潜在世界模型规划
人工智能·机器学习·自动驾驶
modelmd16 小时前
Go 编程语言指南 练习题目分享
开发语言·学习·golang
Nan_Shu_61416 小时前
学习: Threejs (2)
前端·javascript·学习
min18112345616 小时前
PC端零基础跨职能流程图制作教程
大数据·人工智能·信息可视化·架构·流程图
愚公搬代码16 小时前
【愚公系列】《AI+直播营销》015-直播的选品策略(设计直播产品矩阵)
人工智能·线性代数·矩阵
静听松涛13316 小时前
中文PC端多人协作泳道图制作平台
大数据·论文阅读·人工智能·搜索引擎·架构·流程图·软件工程
学历真的很重要17 小时前
LangChain V1.0 Context Engineering(上下文工程)详细指南
人工智能·后端·学习·语言模型·面试·职场和发展·langchain