机器学习:opencv--特征检测

目录

前言

[一、 Harris 角点检测](#一、 Harris 角点检测)

1.基本思想

2.代码实现

[二、 SIFT(尺度不变特征变换)](#二、 SIFT(尺度不变特征变换))

1.代码实现


前言

特征检测是计算机视觉中的一个重要任务,旨在从图像中提取具有辨识度的关键点或区域。这些特征可以用于后续的图像分析、匹配和识别。

一、 Harris 角点检测

  • Harris角点检测算法是一种常用的计算机视觉算法,用于检测图像中的角点。该算法通过计算图像中每个像素的局部自相关矩阵,来判断该像素是否为角点。

1.基本思想

  1. 使用一个固定的小窗口在图像上进行任意方向的滑动,
  2. 比较滑动前与滑动后两种情况,
  3. 窗口中的像素灰度变化程度,
  4. 如果存在任意方向上的滑动,都有着较大灰度变化(sobel算子),
  5. 那么我们可以认为该窗口中存在角点
  • 例如该图中黄色框框就是一个检测窗口,任意方向滑动之后比较滑动前后的变化,如果有较大变化,就认为该窗口存在角点

2.代码实现

  1. 传入图像,变成灰度图
  2. 进行角点检测,返回图像大小的矩阵,矩阵中每个值是每个像素为角点的概率
  3. 该代码中通过是否大于最大概率的十分之一来判断是否是角点
  4. 若是,则标为绿色
python 复制代码
import cv2

"""角点检测harris"""
# 角点指图像中局部区域与周围区域有较大灰度变化的点或像素。
# cornerHarris(img,blockSize,ksize, k[, dst[, borderType]])-> dst
#   img:输入图像。
#   blockSize:角点检测中要考虑的领域大小。
#   ksize:Sobel求导中使用的窗口大小。
#   k:Harris角点检测方程中的自由参数,取值参数为[0.04,0.06]
# dst:返回numpy.ndarray对象,大小和src相同,值越大,对应像素点是角的概奉越高

img = cv2.imread('huanghelou.png')
# img = cv2.imread('huanghelou1.JPG')
# img = cv2.imread('face.jpg')
gray = cv2.cvtColor(img, cv2.COLOR_BGR2GRAY)
dst = cv2.cornerHarris(gray, 4, 3, 0.06)

# 标记检测到的角点
img[dst > 0.1 * dst.max()] = [0, 255, 0]
cv2.imshow('img', img)
cv2.waitKey(0)

print(dst[dst > 0.06 * dst.max()])

输出:

二、 SIFT(尺度不变特征变换)

  • SIFT特征具有对旋转、尺度缩放、亮度变化等保持不变性,是一种非常稳定的局部特征。
  • 其原理是通过高斯图像金字塔以及高斯模糊等系列算法来获取图像的关键点

1.代码实现

  1. 传入图像,变成灰度图
  2. 创建sift对象,
  3. 使用.detect方法查找图像的关键点
  4. 再使用.drawKeypoints方法在图像上绘制出关键点以及关键点的信息
  5. 使用.compute方法计算关键点的描述符,将每个点映射到128维的矩阵内,
  6. 一行数值表示一个点,一个点有128个特征,有助于后面进行不同图像之间的关键点匹配
python 复制代码
import cv2
import numpy as np

"""特征提取sift"""
# 检测图像中的关键点
# cv2.SIFT_create()
# #cv2.xfeatures2d.SIFT_create()#创建一个sift特征的提取对象
# sift.detect(img)在图像中查找关键点

# img = cv2.imread('man.png')
img = cv2.imread('face.jpg')
gray = cv2.cvtColor(img, cv2.COLOR_BGR2GRAY)
sift = cv2.SIFT_create()  # 创建sift对象
kp = sift.detect(gray)  # 查找关键点

# 绘制关键点
# drawKeypoints(image, keypoints, outImage, color=None, flags=None)
# image:原始图片
# keypoints:从原图中获得的关键点,这也是画图时所用到的数据
# outputimage:输出图像,可以是原始图片,也可以是None
# color:颜色设置,通过修改(b,g,r)的值,更改画笔的颜色,b=蓝色,q=绿色,r=红色。
# flags:绘图功能的标识设置
img_sift = cv2.drawKeypoints(img, kp, None, flags=cv2.DRAW_MATCHES_FLAGS_DRAW_RICH_KEYPOINTS)
cv2.imshow('img_sift', img_sift)
cv2.waitKey(0)

# 使用sift.compute()计算关键点描述符,方便后期的特征匹配
kp, des = sift.compute(img, kp)
print(np.array(kp).shape, des.shape)
for i in kp:
    print(i.pt)

输出:

  • 利用kp中的pt属性,获取每个关键点的坐标
相关推荐
迅易科技21 分钟前
借助腾讯云质检平台的新范式,做工业制造企业质检的“AI慧眼”
人工智能·视觉检测·制造
古希腊掌管学习的神1 小时前
[机器学习]XGBoost(3)——确定树的结构
人工智能·机器学习
ZHOU_WUYI2 小时前
4.metagpt中的软件公司智能体 (ProjectManager 角色)
人工智能·metagpt
靴子学长2 小时前
基于字节大模型的论文翻译(含免费源码)
人工智能·深度学习·nlp
AI_NEW_COME3 小时前
知识库管理系统可扩展性深度测评
人工智能
海棠AI实验室4 小时前
AI的进阶之路:从机器学习到深度学习的演变(一)
人工智能·深度学习·机器学习
hunteritself4 小时前
AI Weekly『12月16-22日』:OpenAI公布o3,谷歌发布首个推理模型,GitHub Copilot免费版上线!
人工智能·gpt·chatgpt·github·openai·copilot
IT古董5 小时前
【机器学习】机器学习的基本分类-强化学习-策略梯度(Policy Gradient,PG)
人工智能·机器学习·分类
centurysee5 小时前
【最佳实践】Anthropic:Agentic系统实践案例
人工智能
mahuifa5 小时前
混合开发环境---使用编程AI辅助开发Qt
人工智能·vscode·qt·qtcreator·编程ai