在OpenCV中,图像融合是指将两张或多张图像合并成一张图像的技术。这种技术在很多场景下都非常有用,比如全景图的拼接、多曝光图像的融合、多焦点图像的融合等。下面是一些常用的图像融合方法和技术:
- 加权平均法: 这是最简单的图像融合方法之一,通过给每张图像分配一个权重,然后计算每个像素点上所有图像对应像素值的加权平均值来得到最终的融合图像。这种方法简单但可能会导致边界模糊。
- 多分辨率金字塔融合: 这种方法首先构建每张图像的高斯金字塔和拉普拉斯金字塔,然后在不同的尺度上对图像进行融合,最后通过重建过程得到融合后的图像。这种方法可以较好地保留图像的细节。
- 基于梯度的融合: 在这种融合方法中,会考虑图像的梯度信息,目的是使融合区域的边缘更加自然,减少融合边界处的不连续性。
- 基于小波变换的融合: 使用小波变换将图像分解到不同的频带,然后根据不同频带的特点选择合适的融合规则,最后通过逆小波变换重构图像。这种方法能够很好地保持图像的高频细节。
- 基于深度学习的方法: 随着深度学习的发展,也有研究者开始探索使用神经网络来进行图像融合,比如使用卷积神经网络(CNN)来学习更高级别的特征表示,并据此实现图像融合。
下面主要介绍一下加权平均法和多分辨率金字塔两种方法
加权平均法
这是最简单的图像融合方法之一,通过给每张图像分配一个权重,然后计算每个像素点上所有图像对应像素值的加权平均值来得到最终的融合图像。这种方法简单但可能会导致边界模糊。
此处除了之前一直使用的小猫示例图外,我们再使用另外一张小狗照片来实现图像融合,示例图如下:
加权平均法使用方法addWeighted,其函数原型如下:
py
dst = cv2.addWeighted(src1, alpha, src2, beta, gamma)
其中:
src1
和src2
分别是输入的两个图像,这两个图像需要具有相同的尺寸和类型。alpha
和beta
是分别应用于src1
和src2
的权重。gamma
是一个可选的标量值,它会被直接加到加权和的结果上。- 相当于是
dst = alpha*src1 + beta+src2 + gamma
【示例】使用加权平均法融合猫狗的照片
使用加权平均要确保两张图片大小一致,如果不一样的话,可以使用cv2.resize方法修改图片大小
py
# 融合图片要确保两张图片大小一致
dog = cv2.resize(dog,(629,521))
dog.shape
py
# 融合并展示结果
res = cv2.addWeighted(cat,0.4,dog,0.6,0)
cv_show('res',res)
运行结果:
多分辨率金字塔
在计算机视觉中,多分辨率金字塔用于处理不同尺度下的图像。OpenCV 提供了构建多分辨率金字塔的方法,这有助于图像的缩放和平滑,以及在不同尺度下进行特征检测等任务。多分辨率金字塔通常分为两种类型:高斯金字塔(Gaussian Pyramid)和拉普拉斯金字塔(Laplacian Pyramid)。
高斯金字塔
高斯金字塔是一种通过连续降采样(缩小图像)来创建的一系列图像。每层图像都是前一层图像的一个低通滤波版本,并且尺寸通常是前一层的一半。这种金字塔可以用于多尺度目标检测、图像融合等场景。
【示例】
py
# 高斯金字塔
import cv2
import numpy as np
# 读取图像
img = cv2.imread('cat.jpg')
# 创建高斯金字塔
lower_res1 = cv2.pyrDown(img) # 第一层
lower_res2 = cv2.pyrDown(lower_res1) # 第二层
# 显示原图和金字塔层
cv2.imshow('Original Image', img)
cv2.imshow('Pyramid Level 1', lower_res1)
cv2.imshow('Pyramid Level 2', lower_res2)
cv2.waitKey(0)
cv2.destroyAllWindows()
运行结果:
拉普拉斯金字塔
拉普拉斯金字塔是基于高斯金字塔构建的,它表示的是相邻高斯金字塔层之间的差异。每个拉普拉斯金字塔层都是通过从高斯金字塔的某一层中减去其上一层的放大版本得到的。这种金字塔可以用于图像重建和压缩等任务。
【示例】因为拉普拉斯用到了不同分辨率图像的减法,会让边缘变得更加明显,此处我们使用一张边缘明显的图作为例子
py
import cv2
import numpy as np
# 读取图像
img = cv2.imread('pie.jpg')
# 创建高斯金字塔
gaussian_pyr = [img]
for i in range(3):
img = cv2.pyrDown(img)
gaussian_pyr.append(img)
# 创建拉普拉斯金字塔
laplacian_pyr = []
for i in range(len(gaussian_pyr) - 1, 0, -1):
size = (gaussian_pyr[i - 1].shape[1], gaussian_pyr[i - 1].shape[0])
expanded = cv2.pyrUp(gaussian_pyr[i], dstsize=size)
laplacian = cv2.subtract(gaussian_pyr[i - 1], expanded)
laplacian_pyr.append(laplacian)
# 显示拉普拉斯金字塔层
for i, layer in enumerate(laplacian_pyr):
cv2.imshow(f'Laplacian Level {i}', layer)
cv2.waitKey(0)
cv2.destroyAllWindows()
运行结果: