机器学习:opencv--特征检测

目录

前言

[一、 Harris 角点检测](#一、 Harris 角点检测)

1.基本思想

2.代码实现

[二、 SIFT(尺度不变特征变换)](#二、 SIFT(尺度不变特征变换))

1.代码实现


前言

特征检测是计算机视觉中的一个重要任务,旨在从图像中提取具有辨识度的关键点或区域。这些特征可以用于后续的图像分析、匹配和识别。

一、 Harris 角点检测

  • Harris角点检测算法是一种常用的计算机视觉算法,用于检测图像中的角点。该算法通过计算图像中每个像素的局部自相关矩阵,来判断该像素是否为角点。

1.基本思想

  1. 使用一个固定的小窗口在图像上进行任意方向的滑动,
  2. 比较滑动前与滑动后两种情况,
  3. 窗口中的像素灰度变化程度,
  4. 如果存在任意方向上的滑动,都有着较大灰度变化(sobel算子),
  5. 那么我们可以认为该窗口中存在角点
  • 例如该图中黄色框框就是一个检测窗口,任意方向滑动之后比较滑动前后的变化,如果有较大变化,就认为该窗口存在角点

2.代码实现

  1. 传入图像,变成灰度图
  2. 进行角点检测,返回图像大小的矩阵,矩阵中每个值是每个像素为角点的概率
  3. 该代码中通过是否大于最大概率的十分之一来判断是否是角点
  4. 若是,则标为绿色
python 复制代码
import cv2

"""角点检测harris"""
# 角点指图像中局部区域与周围区域有较大灰度变化的点或像素。
# cornerHarris(img,blockSize,ksize, k[, dst[, borderType]])-> dst
#   img:输入图像。
#   blockSize:角点检测中要考虑的领域大小。
#   ksize:Sobel求导中使用的窗口大小。
#   k:Harris角点检测方程中的自由参数,取值参数为[0.04,0.06]
# dst:返回numpy.ndarray对象,大小和src相同,值越大,对应像素点是角的概奉越高

img = cv2.imread('huanghelou.png')
# img = cv2.imread('huanghelou1.JPG')
# img = cv2.imread('face.jpg')
gray = cv2.cvtColor(img, cv2.COLOR_BGR2GRAY)
dst = cv2.cornerHarris(gray, 4, 3, 0.06)

# 标记检测到的角点
img[dst > 0.1 * dst.max()] = [0, 255, 0]
cv2.imshow('img', img)
cv2.waitKey(0)

print(dst[dst > 0.06 * dst.max()])

输出:

二、 SIFT(尺度不变特征变换)

  • SIFT特征具有对旋转、尺度缩放、亮度变化等保持不变性,是一种非常稳定的局部特征。
  • 其原理是通过高斯图像金字塔以及高斯模糊等系列算法来获取图像的关键点

1.代码实现

  1. 传入图像,变成灰度图
  2. 创建sift对象,
  3. 使用.detect方法查找图像的关键点
  4. 再使用.drawKeypoints方法在图像上绘制出关键点以及关键点的信息
  5. 使用.compute方法计算关键点的描述符,将每个点映射到128维的矩阵内,
  6. 一行数值表示一个点,一个点有128个特征,有助于后面进行不同图像之间的关键点匹配
python 复制代码
import cv2
import numpy as np

"""特征提取sift"""
# 检测图像中的关键点
# cv2.SIFT_create()
# #cv2.xfeatures2d.SIFT_create()#创建一个sift特征的提取对象
# sift.detect(img)在图像中查找关键点

# img = cv2.imread('man.png')
img = cv2.imread('face.jpg')
gray = cv2.cvtColor(img, cv2.COLOR_BGR2GRAY)
sift = cv2.SIFT_create()  # 创建sift对象
kp = sift.detect(gray)  # 查找关键点

# 绘制关键点
# drawKeypoints(image, keypoints, outImage, color=None, flags=None)
# image:原始图片
# keypoints:从原图中获得的关键点,这也是画图时所用到的数据
# outputimage:输出图像,可以是原始图片,也可以是None
# color:颜色设置,通过修改(b,g,r)的值,更改画笔的颜色,b=蓝色,q=绿色,r=红色。
# flags:绘图功能的标识设置
img_sift = cv2.drawKeypoints(img, kp, None, flags=cv2.DRAW_MATCHES_FLAGS_DRAW_RICH_KEYPOINTS)
cv2.imshow('img_sift', img_sift)
cv2.waitKey(0)

# 使用sift.compute()计算关键点描述符,方便后期的特征匹配
kp, des = sift.compute(img, kp)
print(np.array(kp).shape, des.shape)
for i in kp:
    print(i.pt)

输出:

  • 利用kp中的pt属性,获取每个关键点的坐标
相关推荐
华玥作者4 小时前
[特殊字符] VitePress 对接 Algolia AI 问答(DocSearch + AI Search)完整实战(下)
前端·人工智能·ai
AAD555888994 小时前
YOLO11-EfficientRepBiPAN载重汽车轮胎热成像检测与分类_3
人工智能·分类·数据挖掘
王建文go4 小时前
RAG(宠物健康AI)
人工智能·宠物·rag
ALINX技术博客5 小时前
【202601芯动态】全球 FPGA 异构热潮,ALINX 高性能异构新品预告
人工智能·fpga开发·gpu算力·fpga
易营宝5 小时前
多语言网站建设避坑指南:既要“数据同步”,又能“按市场个性化”,别踩这 5 个坑
大数据·人工智能
春日见5 小时前
vscode代码无法跳转
大数据·人工智能·深度学习·elasticsearch·搜索引擎
ASKED_20195 小时前
Langchain学习笔记一 -基础模块以及架构概览
笔记·学习·langchain
Drgfd5 小时前
真智能 vs 伪智能:天选 WE H7 Lite 用 AI 人脸识别 + 呼吸灯带,重新定义智能化充电桩
人工智能·智能充电桩·家用充电桩·充电桩推荐
Lois_Luo5 小时前
Obsidian + Picgo + Aliyun OSS 实现笔记图片自动上传图床
笔记·oss·图床
萤丰信息6 小时前
AI 筑基・生态共荣:智慧园区的价值重构与未来新途
大数据·运维·人工智能·科技·智慧城市·智慧园区