【OpenCV】(五)—— 图像融合

在OpenCV中,图像融合是指将两张或多张图像合并成一张图像的技术。这种技术在很多场景下都非常有用,比如全景图的拼接、多曝光图像的融合、多焦点图像的融合等。下面是一些常用的图像融合方法和技术:

  1. 加权平均法: 这是最简单的图像融合方法之一,通过给每张图像分配一个权重,然后计算每个像素点上所有图像对应像素值的加权平均值来得到最终的融合图像。这种方法简单但可能会导致边界模糊。
  2. 多分辨率金字塔融合: 这种方法首先构建每张图像的高斯金字塔和拉普拉斯金字塔,然后在不同的尺度上对图像进行融合,最后通过重建过程得到融合后的图像。这种方法可以较好地保留图像的细节。
  3. 基于梯度的融合: 在这种融合方法中,会考虑图像的梯度信息,目的是使融合区域的边缘更加自然,减少融合边界处的不连续性。
  4. 基于小波变换的融合: 使用小波变换将图像分解到不同的频带,然后根据不同频带的特点选择合适的融合规则,最后通过逆小波变换重构图像。这种方法能够很好地保持图像的高频细节。
  5. 基于深度学习的方法: 随着深度学习的发展,也有研究者开始探索使用神经网络来进行图像融合,比如使用卷积神经网络(CNN)来学习更高级别的特征表示,并据此实现图像融合。

下面主要介绍一下加权平均法和多分辨率金字塔两种方法

加权平均法

这是最简单的图像融合方法之一,通过给每张图像分配一个权重,然后计算每个像素点上所有图像对应像素值的加权平均值来得到最终的融合图像。这种方法简单但可能会导致边界模糊。

此处除了之前一直使用的小猫示例图外,我们再使用另外一张小狗照片来实现图像融合,示例图如下:

加权平均法使用方法addWeighted,其函数原型如下:

py 复制代码
dst = cv2.addWeighted(src1, alpha, src2, beta, gamma)

其中:

  • src1src2 分别是输入的两个图像,这两个图像需要具有相同的尺寸和类型。
  • alphabeta 是分别应用于 src1src2 的权重。
  • gamma 是一个可选的标量值,它会被直接加到加权和的结果上。
  • 相当于是dst = alpha*src1 + beta+src2 + gamma

【示例】使用加权平均法融合猫狗的照片

使用加权平均要确保两张图片大小一致,如果不一样的话,可以使用cv2.resize方法修改图片大小

py 复制代码
# 融合图片要确保两张图片大小一致
dog = cv2.resize(dog,(629,521))
dog.shape
py 复制代码
# 融合并展示结果
res = cv2.addWeighted(cat,0.4,dog,0.6,0)
cv_show('res',res)

运行结果:

多分辨率金字塔

在计算机视觉中,多分辨率金字塔用于处理不同尺度下的图像。OpenCV 提供了构建多分辨率金字塔的方法,这有助于图像的缩放和平滑,以及在不同尺度下进行特征检测等任务。多分辨率金字塔通常分为两种类型:高斯金字塔(Gaussian Pyramid)和拉普拉斯金字塔(Laplacian Pyramid)。

高斯金字塔

高斯金字塔是一种通过连续降采样(缩小图像)来创建的一系列图像。每层图像都是前一层图像的一个低通滤波版本,并且尺寸通常是前一层的一半。这种金字塔可以用于多尺度目标检测、图像融合等场景。

【示例】

py 复制代码
# 高斯金字塔
import cv2
import numpy as np

# 读取图像
img = cv2.imread('cat.jpg')

# 创建高斯金字塔
lower_res1 = cv2.pyrDown(img)  # 第一层
lower_res2 = cv2.pyrDown(lower_res1)  # 第二层

# 显示原图和金字塔层
cv2.imshow('Original Image', img)
cv2.imshow('Pyramid Level 1', lower_res1)
cv2.imshow('Pyramid Level 2', lower_res2)
cv2.waitKey(0)
cv2.destroyAllWindows()

运行结果:

拉普拉斯金字塔

拉普拉斯金字塔是基于高斯金字塔构建的,它表示的是相邻高斯金字塔层之间的差异。每个拉普拉斯金字塔层都是通过从高斯金字塔的某一层中减去其上一层的放大版本得到的。这种金字塔可以用于图像重建和压缩等任务。

【示例】因为拉普拉斯用到了不同分辨率图像的减法,会让边缘变得更加明显,此处我们使用一张边缘明显的图作为例子

py 复制代码
import cv2
import numpy as np

# 读取图像
img = cv2.imread('pie.jpg')

# 创建高斯金字塔
gaussian_pyr = [img]
for i in range(3):
    img = cv2.pyrDown(img)
    gaussian_pyr.append(img)

# 创建拉普拉斯金字塔
laplacian_pyr = []
for i in range(len(gaussian_pyr) - 1, 0, -1):
    size = (gaussian_pyr[i - 1].shape[1], gaussian_pyr[i - 1].shape[0])
    expanded = cv2.pyrUp(gaussian_pyr[i], dstsize=size)
    laplacian = cv2.subtract(gaussian_pyr[i - 1], expanded)
    laplacian_pyr.append(laplacian)

# 显示拉普拉斯金字塔层
for i, layer in enumerate(laplacian_pyr):
    cv2.imshow(f'Laplacian Level {i}', layer)

cv2.waitKey(0)
cv2.destroyAllWindows()

运行结果:

相关推荐
良木生香几秒前
【C++初阶】STL——Vector从入门到应用完全指南(1)
开发语言·c++·神经网络·算法·计算机视觉·自然语言处理·数据挖掘
DogDaoDao1 分钟前
【GitHub】OpenClaw:开源个人AI助手的新标杆
人工智能·深度学习·开源·大模型·github·ai编程·opeclaw
byte轻骑兵2 分钟前
【AVRCP】规范精讲[10]:链路管理器LM互操作规则与场景落地
人工智能·音视频·蓝牙·avrcp·音视频控制
70asunflower3 分钟前
AI推理时代的逻辑重构
人工智能·重构
海兰8 分钟前
【开篇】Spring AI、OpenClaw 和Hermes
java·人工智能·spring·spring ai
带娃的IT创业者8 分钟前
Zig 项目反AI贡献政策:一场关于开源灵魂的保卫战
人工智能·开源·ai编程·代码质量·github copilot·zig
love530love9 分钟前
如何在 Google Chrome 中强制开启 Gemini AI 侧边栏(完整图文教程)
前端·人工智能·chrome·windows
憨波个10 分钟前
【说话人日志】DOVER:diarization 输出融合算法
人工智能·算法·音频·语音识别·聚类
skilllite作者11 分钟前
Zed 1.0 编辑器深度评测与实战指南
开发语言·人工智能·windows·python·编辑器·agi
送秋三十五12 分钟前
如何让 AI“看懂”网页?拆解 Browser-Use 的三大核心技术模块(前)
人工智能