计算机视觉——Opencv(角点检测和特征提取)

Harris 角点检测

1.什么是Harris 角点检测

Harris角点检测算法是一种常用的计算机视觉算法,用于检测图像中的角点。该算法通过计算图像中每个像素的局部自相关矩阵,来判断该像素是否为角点。

Harris 角点检测通过计算像素点在各个方向上的灰度变化,来判断该点是否为角点,其核心优势是具有旋转不变性。

2.角点检测算法的基本思想

使用一个固定的小窗口在图像上进行任意方向的滑动,比较滑动前与滑动后两种情况,窗口中的像素灰度变化程度,如果存在任意方向上的滑动,都有着较大灰度变化(sobel算子),那么我们可以认为该窗口中存在角点。

3.实现 Harris 角点检测

Harris 角点检测的核心函数是cornerHarris(img, blockSize, ksize, k[, dst[, borderType]]) -> dst

参数说明:

img: 输入图像。

blockSize: 角点检测中要考虑的领域大小。

ksize: Sobel求导中使用的窗口大小。

k: Harris角点检测方程中的自由参数,取值参数为 [0.04, 0.06]。

dst: 返回numpy.ndarray对象,大小和src相同,值越大,对应像素点是角的概率越高

代码如下:

python 复制代码
import cv2
import numpy as np

img = cv2.imread(r"C:\Users\LEGION\Desktop\OIP-C.webp")
#转为灰度图
gray = cv2.cvtColor(img, cv2.COLOR_BGR2GRAY)
#执行Harris角点检测
dst = cv2.cornerHarris(gray, blockSize=4, ksize=3, k=0.04)

# 标记检测到的角点
img[dst > 0.01 * dst.max()] = [0, 0, 255]
# 这里通过对角点响应进行阈值处理,标记出检测到的角点。
# 0.05 * dst.max() 是一个阈值,大于这个值的像素点会被标记为红色。

cv2.imshow('img', img)
cv2.waitKey(0)

图像预处理 :彩色图像包含 RGB 三个通道的信息,角点检测只需要灰度信息即可,因此使用cv2.cvtColor()将彩色图转换为灰度图,减少计算量。

角点检测函数: cv2.cornerHarris()的返回值dst是一个与输入图像大小相同的 numpy 数组,每个元素对应原图像中对应像素点的角点响应值,响应值越高,该点是角点的可能性越大。

角点标记: 没有直接使用dst的原始值进行判断,而是使用阈值。这样可以过滤掉大量弱响应点,只保留最有可能的角点

运行结果:

SIFT 特征提取

1. 什么是 SIFT

SIFT(Scale Invariant Feature Transform)尺度不变特征变换。SIFT特征具有对旋转、尺度缩放、亮度变化等保持不变性,是一种非常稳定的局部特征。

2.SIFT 特征提取主要分为两个步骤

检测关键点(与 Harris 角点类似,但具有尺度不变性)。

计算关键点的描述符(将关键点转换为一组固定长度的向量,方便后期的特征匹配)。

3.SIFT算法的特点

1、图像的局部特征,对旋转、尺度缩放、亮度变化保持不变,对视角变化、仿射变换、噪声也保持一定程度的稳定性。

2、独特性好,信息量丰富,适用于海量特征库进行快速、准确的匹配。

3、多量性,即使是很少几个物体也可以产生大量的SIFT特征

4、高速性,经优化的SIFT匹配算法甚至可以达到实时性

5、扩招性,可以很方便的与其他的特征向量进行联合。

4.实现 SIFT 特征提取

python 复制代码
man = cv2.imread(r"C:\Users\LEGION\Desktop\OIP-C.webp")
man_gray = cv2.cvtColor(man, cv2.COLOR_BGR2GRAY)#
sift = cv2.SIFT_create()  #sift对象
kp = sift.detect(man_gray)


man_sift = cv2.drawKeypoints(man, kp, outImage=None, flags=cv2.DRAW_MATCHES_FLAGS_DRAW_RICH_KEYPOINTS)
cv2.imshow('man_sift', man_sift)
cv2.waitKey(0)

# 使用sift.compute()计算关键点描述符,方便后期的特征匹配
kp, des = sift.compute(man, kp)  #
print(np.array(kp).shape, des.shape)
# 输出关键点的形状和描述符的形状。
# np.array(kp).shape 表示关键点的数量和属性。
# des.shape 表示描述符的数量和属性。

创建 SIFT 对象cv2.SIFT_create()是创建 SIFT 特征提取对象的核心函数

检测关键点sift.detect()接收灰度图作为输入,返回一个关键点列表kp,每个关键点包含多个属性:

  • kp.pt:关键点的 (x, y) 像素坐标。

  • kp.size:关键点的大小(对应尺度空间中的尺度)。

  • kp.angle:关键点的方向(范围 0-360 度,保证旋转不变性)。

  • kp.response:关键点的响应值,用于筛选强特征点。

计算描述符sift.compute()用于计算关键点的描述符,描述符des是一个二维 numpy 数组,形状为(N, 128),其中N是关键点的数量,128 表示每个关键点对应一个 128 维的向量。这个向量具有独特性,能够唯一描述一个关键点,为后期的图像特征匹配提供数据支持。

输出形状信息np.array(kp).shape会输出关键点的数量(比如(120,)表示检测到 120 个关键点),des.shape会输出(120, 128),表示 120 个关键点对应 120 个 128 维描述符。

运行结果:

表示 347个关键点对应 347 个 128 维描述符

注意:

SIFT 算法对图像的光照变化具有一定的鲁棒性,但在强光照差异下效果会下降。

检测到的关键点数量与图像的复杂度相关,图像纹理越丰富,关键点数量越多。

128 维描述符是 SIFT 算法的默认设置,具有良好的独特性和匹配性能,无需特别修改。

相关推荐
jerryinwuhan3 小时前
LORA时间
人工智能
码农葫芦侠3 小时前
Vercel Labs Skills:AI 编程安装「技能Skills」的工具
人工智能·ai·ai编程
宝贝儿好3 小时前
【强化学习】第十章:连续动作空间强化学习:随机高斯策略、DPG算法
人工智能·python·深度学习·算法·机器人
未来之窗软件服务3 小时前
AI人工智能(二十三)错误示范ASR 语音识别C#—东方仙盟练气期
人工智能·c#·语音识别·仙盟创梦ide·东方仙盟
金智维科技官方3 小时前
智能体,重构企业自动化未来
人工智能·自动化·agent·智能体·数字员工
桂花饼3 小时前
谷歌正式发布 Gemini 3.1 Pro:核心智能升级与国内极速接入指南
人工智能·qwen3-next·claude-sonnet·sora2pro·gemini-3.1pro·grok-420-fast·openclaw 配置教程
Mixtral4 小时前
2026年3款AI会议记录工具测评:告别会后整理
人工智能
Evand J4 小时前
【课题推荐】深度学习驱动的交通流量预测系统(基于LSTM的交通流量预测系统),MATLAB实现
人工智能·深度学习·matlab·课题简介
甲枫叶4 小时前
【claude热点资讯】Claude Code 更新:手机遥控电脑开发,Remote Control 功能上线
java·人工智能·智能手机·产品经理·ai编程
光头颜4 小时前
任务分解与子 Agent 调度:Controller/Worker 模式的最小可运行实现(SQL + 文档 RAG)
人工智能·智能体