OpenCV(四十八)：图像查找

OpenCV（Open Source Computer Vision Library）是一个开源的计算机视觉和机器学习软件库，广泛用于图像处理、分析和理解。在图像查找领域，OpenCV 提供了多种技术，用于在图像中搜索特定图案、匹配相似图像或检索相关内容。图像查找（Image Search）通常涉及模板匹配、特征提取与匹配、直方图比较、感知哈希等方法。这些方法适用于不同的场景：模板匹配适合精确位置查找，特征匹配处理旋转、缩放等变换，直方图比较评估颜色分布相似度，感知哈希用于大规模图像相似性搜索。

模板匹配（Template Matching）

模板匹配是一种基本的图像查找方法，用于在较大图像中搜索并定位模板图像的位置。它类似于 2D 卷积操作，通过滑动模板在源图像上计算相似度。OpenCV 的 cv.matchTemplate() 函数实现了这一功能，支持多种比较方法，如相关系数（TM_CCOEFF）、平方差（TM_SQDIFF）等。匹配结果是一个灰度图像，每个像素值表示匹配度。

1. 原理

模板匹配是最直观的图像查找方法，其本质是二维滑动窗口的相关性计算，类似于卷积操作。

核心原理：

将模板图像 T（大小为 w×h）在源图像 I（大小为 W×H）上逐像素滑动。
在每个位置 (x,y)，计算模板与该位置覆盖的子图像区域的相似度。
最终得到一个 (W-w+1) × (H-h+1) 大小的匹配结果图（result map），其中每个像素值表示该位置的匹配分数。

OpenCV 提供了 6 种匹配方法，其数学公式如下（假设 I 为源图像，T 为模板）：

TM_SQDIFF（平方差匹配）
TM_SQDIFF_NORMED（归一化平方差）
TM_CCORR（相关匹配）
TM_CCORR_NORMED（归一化相关）
TM_CCOEFF（相关系数匹配）
TM_CCOEFF_NORMED（归一化相关系数）范围 [-1,1]，1 表示完美匹配，推荐最常用。

优点：实现简单、计算快速（可硬件加速）。缺点：对尺度、旋转、光照变化极度敏感，仅适用于模板与目标几乎完全一致的场景。

2. 基本模板匹配

理论：模板在源图像上滑动，计算每个位置的匹配分数。对于 TM_SQDIFF 方法，最小值表示最佳匹配；对于 TM_CCOEFF 等，最大值最佳。使用 cv.minMaxLoc() 找到全局最佳位置。

Python 示例：查找 Messi 照片中的脸部模板。

python 复制代码

# 基本模板匹配

import cv2 as cv
import numpy as np
from matplotlib import pyplot as plt

# 加载图像（灰度）
img = cv.imread('messi5.jpg', cv.IMREAD_GRAYSCALE)
template = cv.imread('template.jpg', cv.IMREAD_GRAYSCALE)

w, h = template.shape[::-1]  # 模板宽高

# 应用模板匹配（使用归一化相关系数）
res = cv.matchTemplate(img, template, cv.TM_CCOEFF_NORMED)

# 找到最大值位置
min_val, max_val, min_loc, max_loc = cv.minMaxLoc(res)
top_left = max_loc
bottom_right = (top_left[0] + w, top_left[1] + h)

# 绘制矩形
cv.rectangle(img, top_left, bottom_right, 255, 2)

# 显示结果
plt.imshow(img, cmap='gray')
plt.title('Detected Face')
plt.show()

3. 多尺度模板匹配

标准模板匹配对尺寸变化敏感。多尺度方法通过多次缩放源图像或模板来处理。使用图像金字塔或线性缩放循环。

Python 示例：检测不同尺寸的 Call of Duty 标志。

python 复制代码

# 多尺度模板匹配

import cv2 as cv
import numpy as np
import imutils  # 需要 pip install imutils

# 加载模板和图像
template = cv.imread('template.jpg', cv.IMREAD_GRAYSCALE)
image = cv.imread('messi5.jpg', cv.IMREAD_GRAYSCALE)

# 边缘检测
template_edges = cv.Canny(template, 50, 200)
(tH, tW) = template_edges.shape[:2]

found = None

# 循环不同尺度
for scale in np.linspace(0.2, 1.0, 20)[::-1]:
    resized = imutils.resize(image, width=int(image.shape[1] * scale))
    r = image.shape[1] / float(resized.shape[1])
    
    if resized.shape[0] < tH or resized.shape[1] < tW:
        break
    
    edged = cv.Canny(resized, 50, 200)
    result = cv.matchTemplate(edged, template_edges, cv.TM_CCOEFF)
    (_, maxVal, _, maxLoc) = cv.minMaxLoc(result)
    
    if found is None or maxVal > found[0]:
        found = (maxVal, maxLoc, r)

# 绘制最佳匹配
(_, maxLoc, r) = found
(startX, startY) = (int(maxLoc[0] * r), int(maxLoc[1] * r))
(endX, endY) = (int((maxLoc[0] + tW) * r), int((maxLoc[1] + tH) * r))
cv.rectangle(image, (startX, startY), (endX, endY), (0, 0, 255), 2)
cv.imshow("Result", image)
cv.waitKey(0)

4. 多对象检测

对于多个相似对象，使用阈值过滤匹配图中的高值位置。

Python 示例：检测 Mario 图像中的多个硬币。

python 复制代码

# 多对象检测

import cv2 as cv
import numpy as np

img_rgb = cv.imread('mario.png')
img_gray = cv.cvtColor(img_rgb, cv.COLOR_BGR2GRAY)
template = cv.imread('coin.png', cv.IMREAD_GRAYSCALE)
w, h = template.shape[::-1]

res = cv.matchTemplate(img_gray, template, cv.TM_CCOEFF_NORMED)
threshold = 0.8
loc = np.where(res >= threshold)

for pt in zip(*loc[::-1]):
    cv.rectangle(img_rgb, pt, (pt[0] + w, pt[1] + h), (0, 0, 255), 2)

cv.imwrite('detected_coins.png', img_rgb)

特征检测与匹配（Feature Detection and Matching）

特征匹配通过提取图像关键点（如角点、边缘）和描述符（如向量表示），然后匹配它们。OpenCV 支持 SIFT、SURF、ORB 等检测器。匹配器包括 Brute-Force (BF) 和 FLANN。

1. 原理

特征匹配是目前最强大、最鲁棒的图像匹配方法，核心思想是：找到图像中对尺度、旋转、光照具有不变性的局部特征点（keypoints），并用描述符（descriptors）表示其周围区域，然后匹配描述符。

关键步骤与原理：

关键点检测（Keypoint Detection）

寻找图像中显著、稳定的点（如角点、斑点）。常见检测器：
- SIFT：在多尺度空间（DoG，Difference of Gaussian）中寻找极值点，具有尺度不变性。
- SURF：使用 Hessian 矩阵近似，加速计算。
- ORB：基于 FAST 角点检测 + BRIEF 描述子，添加方向信息实现旋转不变性。
描述符生成（Descriptor Extraction）

为每个关键点生成一个固定长度的向量，描述其局部邻域外观。
- SIFT：128 维浮点向量（梯度方向直方图）。
- ORB：256 位二进制字符串（二进制比较极快）。
- 描述符设计目标：对光照、视角、尺度变化具有鲁棒性。
描述符匹配（Descriptor Matching）
- 暴力匹配（Brute-Force）：计算所有描述符对之间的距离（欧氏距离或汉明距离）。
- FLANN（Fast Library for Approximate Nearest Neighbors）：使用 KD-Tree 或 LSH 加速近似最近邻搜索。
- Lowe 比率测试（SIFT 经典）：对于一个描述符的最好匹配和次好匹配，若距离比 < 0.7，则保留该匹配，过滤误匹配。
几何验证（可选） 使用 RANSAC 计算单应性矩阵（Homography）或基础矩阵（Fundamental Matrix），剔除外点（outliers），进一步提高准确率。

优点：对尺度、旋转、部分遮挡、视角变化鲁棒，适用于物体识别、图像拼接、全景图等。缺点：计算量较大（尤其是 SIFT），对纹理极少的图像（如纯色区域）失效。

2. ORB 特征检测与 BF 匹配

ORB（Oriented FAST and Rotated BRIEF）是快速的二进制描述符，对旋转和缩放有一定鲁棒性。

Python 示例：匹配两个图像中的关键点。

python 复制代码

import cv2 as cv
import matplotlib.pyplot as plt

img1 = cv.imread('box.png', cv.IMREAD_GRAYSCALE)  # 查询图像
img2 = cv.imread('box_in_scene.png', cv.IMREAD_GRAYSCALE)  # 训练图像

orb = cv.ORB_create()
kp1, des1 = orb.detectAndCompute(img1, None)
kp2, des2 = orb.detectAndCompute(img2, None)

bf = cv.BFMatcher(cv.NORM_HAMMING, crossCheck=True)
matches = bf.match(des1, des2)
matches = sorted(matches, key=lambda x: x.distance)

img3 = cv.drawMatches(img1, kp1, img2, kp2, matches[:10], None, flags=cv.DrawMatchesFlags_NOT_DRAW_SINGLE_POINTS)
plt.imshow(img3)
plt.show()

3. SIFT 特征与 FLANN 匹配

SIFT（Scale-Invariant Feature Transform）对缩放和旋转不变，但计算较慢。使用 Lowe 的比率测试过滤匹配。

Python 示例：

python 复制代码

import cv2 as cv
import matplotlib.pyplot as plt

img1 = cv.imread('box.png', cv.IMREAD_GRAYSCALE)
img2 = cv.imread('box_in_scene.png', cv.IMREAD_GRAYSCALE)

sift = cv.SIFT_create()
kp1, des1 = sift.detectAndCompute(img1, None)
kp2, des2 = sift.detectAndCompute(img2, None)

FLANN_INDEX_KDTREE = 1
index_params = dict(algorithm=FLANN_INDEX_KDTREE, trees=5)
search_params = dict(checks=50)
flann = cv.FlannBasedMatcher(index_params, search_params)

matches = flann.knnMatch(des1, des2, k=2)

matchesMask = [[0,0] for i in range(len(matches))]
for i, (m, n) in enumerate(matches):
    if m.distance < 0.7 * n.distance:
        matchesMask[i] = [1,0]

draw_params = dict(matchColor=(0,255,0), singlePointColor=(255,0,0), matchesMask=matchesMask, flags=cv.DrawMatchesFlags_DEFAULT)
img3 = cv.drawMatchesKnn(img1, kp1, img2, kp2, matches, None, **draw_params)
plt.imshow(img3)
plt.show()

直方图比较（Histogram Comparison）

直方图表示图像像素分布，用于比较颜色相似度。OpenCV 的 cv.compareHist() 支持相关性（CORREL）、卡方（CHISQR）等度量。

1. 原理

直方图比较是一种全局颜色/亮度分布相似性度量，不关心空间位置。

核心原理：

将图像划分到颜色空间的 bin（如 HSV 的 H:180, S:256, V:256）。
统计每个 bin 的像素数量，形成直方图向量。
使用统计距离度量两个直方图的相似度。

OpenCV 提供的 4 种比较方法：

HISTCMP_CORREL（相关性）
HISTCMP_CHISQR（卡方距离）
HISTCMP_INTERSECT（交集）
HISTCMP_BHATTACHARYYA（巴氏距离）

优点：对平移、轻微旋转不敏感，计算极快。缺点：完全忽略空间信息，两张颜色分布相同但内容完全不同的图像会被判定为相似。

2. 基本直方图比较

理论：计算两个图像的直方图，然后使用度量比较。值越接近 1（相关性），图像越相似。

Python 示例：比较两张图像的相似度。

python 复制代码

import cv2 as cv
import numpy as np

def calc_hist(img):
    hist = [cv.calcHist([img], [i], None, [256], [0, 256]) for i in range(3)]
    return np.concatenate(hist)

img1 = cv.imread('image1.jpg')
img2 = cv.imread('image2.jpg')

hist1 = calc_hist(img1)
hist2 = calc_hist(img2)

# 比较方法
methods = [cv.HISTCMP_CORREL, cv.HISTCMP_CHISQR, cv.HISTCMP_INTERSECT, cv.HISTCMP_BHATTACHARYYA]
for method in methods:
    result = cv.compareHist(hist1, hist2, method)
    print(f"Method {method}: {result}")

3. 直方图匹配（Histogram Matching）

调整一幅图像的直方图以匹配另一幅，用于风格迁移。

Python 示例：使用 skimage（需 pip install scikit-image）。

python 复制代码

from skimage.exposure import match_histograms
import cv2 as cv

source = cv.imread('source.jpg')
reference = cv.imread('reference.jpg')

matched = match_histograms(source, reference, channel_axis=-1)
cv.imwrite('matched.jpg', matched)

感知哈希（Perceptual Hashing）

感知哈希生成固定长度哈希值，相似图像有相似哈希。用于大规模图像检索，通过汉明距离比较。

1. 原理

感知哈希是一种图像指纹技术，用于快速判断两张图像是否视觉相似，特别适合大规模图像去重和近似搜索。

核心原理：

将图像压缩到极小尺寸（如 8×8 或 32×32），去除高频细节，保留整体结构和亮度分布。
提取低频信息，生成固定长度的哈希值（通常 64 位）。
相似图像的哈希值汉明距离（Hamming Distance）很小。

常见算法：

aHash（平均哈希）
- 缩放到 8×8，计算灰度均值。
- 每个像素与均值比较，大于均值为 1，否则为 0，得 64 位哈希。
pHash（感知哈希）
- 缩放到 32×32，应用 DCT（离散余弦变换）。
- 取左上角 8×8 低频系数，计算均值，二值化生成 64 位哈希。
- 更符合人类视觉系统（HVS）。
dHash（差异哈希）
- 缩放到 9×8，每行比较相邻像素（左>右为 1），得 8×8=64 位。
- 对渐变更敏感。

比较方式：计算两个哈希的汉明距离（位不同的数量）。通常距离 ≤ 5 表示高度相似，≤ 10 表示可能相似。

优点：速度极快、抗轻微编辑（压缩、调色、水印），适合海量图像检索。缺点：无法提供位置信息，对大幅裁剪或变形敏感。

2. 差异哈希（dHash）

使用 imagehash 库（pip install imagehash）。

Python 示例：计算并比较哈希。

python 复制代码

from imagehash import dhash
from PIL import Image
import cv2 as cv

def compute_hash(image_path):
    img = Image.open(image_path)
    return dhash(img)

hash1 = compute_hash('wukong1.jpg')
hash2 = compute_hash('wukong2.jpg')
distance = hash1 - hash2
print(f"Hamming Distance: {distance}")

3. OpenCV 的 pHash

OpenCV 内置 img_hash 模块。

Python 示例：

python 复制代码

import cv2 as cv

phash = cv.img_hash.PHash_create()
img1 = cv.imread('wukong1.jpg')
img2 = cv.imread('wukong2.jpg')

hash1 = phash.compute(img1)
hash2 = phash.compute(img2)
similarity = phash.compare(hash1, hash2)
print(f"Similarity: {similarity}")

总结对比

方法	原理基础	对尺度不变	对旋转不变	对光照不变	计算速度	适用场景
模板匹配	滑动相关计算	×	×	△	快	精确位置查找、固定模板
特征匹配	局部不变特征+描述符	✓	✓	✓	中	物体识别、图像配准、AR
直方图比较	全局颜色分布统计	✓	✓	△	极快	颜色相似检索、场景分类
感知哈希	低频指纹+汉明距离	△	△	✓	极快	图像去重、近似搜索、反爬虫