实现在一张图片中寻找另一张图片的目标

OpenCV库中的SIFT特征检测算法和FLANN(快速最近邻搜索库)匹配算法来找到一个图片中的元素在另一个图片中的位置,并在源图片中标出它们的位置。

以下是一个简单的例子,使用OpenCV库,利用SIFT特征检测算法,在一张图片中找到另外一张图片中的目标,这其中目标图片中的元素被识别为"模板",被查找的图片中的元素被识别为"源",代码示例如下:

python 复制代码
import cv2


def fetch_match():
    template = cv2.imread("tmp.jpg")
    source = cv2.imread("source.jpg")
    template_gray = cv2.cvtColor(template, cv2.COLOR_BGRA2GRAY)
    source_gray = cv2.cvtColor(source, cv2.COLOR_BGRA2GRAY)
    try:  #  OpenCV 库到版本3.0及更高版本支持调用此方法
        sift = cv2.xfeatures2d.SIFT_create()
    except Exception as e:
        sift = cv2.SIFT_create()  # 低版本会调用此方法
    kp1, des1 = sift.detectAndCompute(template_gray, None)
    kp2, des2 = sift.detectAndCompute(source_gray, None)

    flann = cv2.FlannBasedMatcher({"algorithm": 0, "trees": 5}, {"checks": 50})
    matches = flann.knnMatch(des1, des2, k=2)

    good_matches = []
    for m, n in matches:
        if m.distance < 0.7 * n.distance:
            good_matches.append(m)
    result = cv2.drawMatches(template, kp1, source, kp2, good_matches, None)
    cv2.imshow("Result", result)
    cv2.waitKey(0)
    cv2.destroyAllWindows()

fetch_match()

效果如下:
具体方法介绍

sift.detectAndCompute():是SIFT算法中的一个方法,用于检测关键点并计算描述符。该方法需要传入一幅图像,并返回检测到的关键点和对应的描述符

python 复制代码
img = cv2.imread("img.png")
# 创建sift对象
try:
    sift = cv2.xfeatures2d.SIFT_create()
except Exception as e:
    sift = cv2.SIFT_create()
# 检测关键点并计算描述符
kp, des = sift.detectAndCompute(img, None)

cv2.FlannBasedMatcher():是OpenCV中的一个匹配器,基于FLANN算法进行匹配。FLANN是快速最近邻搜索库的缩写。该方法需要一个参数字典以设置FLANN算法的参数,并且需要一个检索器参数和一个搜索参数。示例代码如下:

python 复制代码
# 创建FlannBasedMatcher 对象
    flann = cv2.FlannBasedMatcher({"algorithm": 0, "trees": 5}, {"checks": 50})

flann.knnMatch(): 是OpenCV中的一个FLANN最近邻算法匹配函数,用于在两组描述符之间进行最近邻搜索。该方法接受两组描述符作为输入,并返回描述符的匹配。示例代码如下

python 复制代码
# 创建FlannBasedMatcher 对象
flann = cv2.FlannBasedMatcher({"algorithm": 0, "trees": 5}, {"checks": 50})
# 应用knnMatch来找到好的匹配
matches = flann.knnMatch(des1, des2, k=2)

cv2.drawMatches():是OpenCV中的一个绘图函数,用于绘制两幅图像之间的匹配。该方法需要传入两幅图像、描述符和匹配。示例代码如下:

python 复制代码
img1 = cv2.imread("img.png")
img2 = cv2.imread("img_1.png")
# 创建SIFT对象
try:
    sift = cv2.xfeatures2d.SIFT_create()
except Exception as e:
    sift = cv2.SIFT_create()
# 找到关键点和描述符
kp1, des1 = sift.detectAndCompute(img1, None)
kp2, des2 = sift.detectAndCompute(img2, None)
# 创建FlannBasedMatcher对象
flann = cv2.FlannBasedMatcher({'algorithm': 0, 'trees': 5}, {'checks': 50})
# 查找匹配数据
matches = flann.knnMatch(des1, des2, k=2)
good_matches = []
for  m, n in matches:
    if m.distance < 0.7 * n.distance:
        good_matches.append(m)
result_img = cv2.drawMatches(img1, kp1, img2, kp2, good_matches, None, flags=2)

SIFT算法的主要思想

通过连续的图像滤波和关键点检测来提取描述图像中稳定的局部特征。SIFT算法对图像进行多次高斯平滑滤波,并计算不同尺度和方向上的梯度幅值和方向,得出图像中的局部特征。然后,通过Oriented Histogram描述符来描述这些特征。

以下是关键步骤:

  1. 构建高斯金字塔

    先对图像进行高斯模糊操作,通过不断降采样得到一个二维高斯金字塔,每一层都是前一层的1/4 大小。通过这个金字塔,可以表示不同的变化尺度。

  2. 检测极值点

    在高斯金字塔中找到那些在空间和尺度上都是极大值或极小值的点。这些点通常称为关键点,因为它们在各个尺度上都是稳定的。

  3. 精确定位关键点

    对于检测到的关键点,使用一个偏导数的Hessian矩阵来获取关键点的精确位置和尺度。

  4. 确定关键点的主方向

    根据关键点周围像素的梯度方向,计算出关键点的主方向。然后将关键点描述符旋转至该方向,以提高描述符的不变性。

  5. 描述符生成

    将关键点附近的像素划分成小块,并计算每个块内像素的梯度幅值和方向。然后利用一个128维特征向量来描述关键点。这个描述符具有旋转不变性、缩放不变性和视角不变性。

python 复制代码
img = cv2.imread("img.png")
try:
     sift = cv2.xfeatures2d.SIFT_create()
 except Exception as e:
     sift = cv2.SIFT_create()
 kp, des = sift.detectAndCompute(img, None)
 # 在图像上绘制关键点
 result = cv2.drawKeypoints(img, kp, None, flags=cv2.DRAW_MATCHES_FLAGS_DRAW_RICH_KEYPOINTS)
# 窗口显示图像
cv2.imshow("Result", result)
cv2.waitKey(0)
cv2.destroyAllWindows()
相关推荐
精灵vector1 小时前
构建专家级SQL Agent交互
python·aigc·ai编程
Zonda要好好学习1 小时前
Python入门Day2
开发语言·python
Vertira1 小时前
pdf 合并 python实现(已解决)
前端·python·pdf
太凉1 小时前
Python之 sorted() 函数的基本语法
python
项目題供诗2 小时前
黑马python(二十四)
开发语言·python
晓13132 小时前
OpenCV篇——项目(二)OCR文档扫描
人工智能·python·opencv·pycharm·ocr
是小王同学啊~2 小时前
(LangChain)RAG系统链路向量检索器之Retrievers(五)
python·算法·langchain
AIGC包拥它2 小时前
提示技术系列——链式提示
人工智能·python·langchain·prompt
孟陬2 小时前
Python matplotlib 如何**同时**展示正文和 emoji
python
何双新3 小时前
第 1 课:Flask 简介与环境配置(Markdown 教案)
后端·python·flask