机器学习:opencv--特征检测

目录

前言

[一、 Harris 角点检测](#一、 Harris 角点检测)

1.基本思想

2.代码实现

[二、 SIFT(尺度不变特征变换)](#二、 SIFT(尺度不变特征变换))

1.代码实现


前言

特征检测是计算机视觉中的一个重要任务,旨在从图像中提取具有辨识度的关键点或区域。这些特征可以用于后续的图像分析、匹配和识别。

一、 Harris 角点检测

  • Harris角点检测算法是一种常用的计算机视觉算法,用于检测图像中的角点。该算法通过计算图像中每个像素的局部自相关矩阵,来判断该像素是否为角点。

1.基本思想

  1. 使用一个固定的小窗口在图像上进行任意方向的滑动,
  2. 比较滑动前与滑动后两种情况,
  3. 窗口中的像素灰度变化程度,
  4. 如果存在任意方向上的滑动,都有着较大灰度变化(sobel算子),
  5. 那么我们可以认为该窗口中存在角点
  • 例如该图中黄色框框就是一个检测窗口,任意方向滑动之后比较滑动前后的变化,如果有较大变化,就认为该窗口存在角点

2.代码实现

  1. 传入图像,变成灰度图
  2. 进行角点检测,返回图像大小的矩阵,矩阵中每个值是每个像素为角点的概率
  3. 该代码中通过是否大于最大概率的十分之一来判断是否是角点
  4. 若是,则标为绿色
python 复制代码
import cv2

"""角点检测harris"""
# 角点指图像中局部区域与周围区域有较大灰度变化的点或像素。
# cornerHarris(img,blockSize,ksize, k[, dst[, borderType]])-> dst
#   img:输入图像。
#   blockSize:角点检测中要考虑的领域大小。
#   ksize:Sobel求导中使用的窗口大小。
#   k:Harris角点检测方程中的自由参数,取值参数为[0.04,0.06]
# dst:返回numpy.ndarray对象,大小和src相同,值越大,对应像素点是角的概奉越高

img = cv2.imread('huanghelou.png')
# img = cv2.imread('huanghelou1.JPG')
# img = cv2.imread('face.jpg')
gray = cv2.cvtColor(img, cv2.COLOR_BGR2GRAY)
dst = cv2.cornerHarris(gray, 4, 3, 0.06)

# 标记检测到的角点
img[dst > 0.1 * dst.max()] = [0, 255, 0]
cv2.imshow('img', img)
cv2.waitKey(0)

print(dst[dst > 0.06 * dst.max()])

输出:

二、 SIFT(尺度不变特征变换)

  • SIFT特征具有对旋转、尺度缩放、亮度变化等保持不变性,是一种非常稳定的局部特征。
  • 其原理是通过高斯图像金字塔以及高斯模糊等系列算法来获取图像的关键点

1.代码实现

  1. 传入图像,变成灰度图
  2. 创建sift对象,
  3. 使用.detect方法查找图像的关键点
  4. 再使用.drawKeypoints方法在图像上绘制出关键点以及关键点的信息
  5. 使用.compute方法计算关键点的描述符,将每个点映射到128维的矩阵内,
  6. 一行数值表示一个点,一个点有128个特征,有助于后面进行不同图像之间的关键点匹配
python 复制代码
import cv2
import numpy as np

"""特征提取sift"""
# 检测图像中的关键点
# cv2.SIFT_create()
# #cv2.xfeatures2d.SIFT_create()#创建一个sift特征的提取对象
# sift.detect(img)在图像中查找关键点

# img = cv2.imread('man.png')
img = cv2.imread('face.jpg')
gray = cv2.cvtColor(img, cv2.COLOR_BGR2GRAY)
sift = cv2.SIFT_create()  # 创建sift对象
kp = sift.detect(gray)  # 查找关键点

# 绘制关键点
# drawKeypoints(image, keypoints, outImage, color=None, flags=None)
# image:原始图片
# keypoints:从原图中获得的关键点,这也是画图时所用到的数据
# outputimage:输出图像,可以是原始图片,也可以是None
# color:颜色设置,通过修改(b,g,r)的值,更改画笔的颜色,b=蓝色,q=绿色,r=红色。
# flags:绘图功能的标识设置
img_sift = cv2.drawKeypoints(img, kp, None, flags=cv2.DRAW_MATCHES_FLAGS_DRAW_RICH_KEYPOINTS)
cv2.imshow('img_sift', img_sift)
cv2.waitKey(0)

# 使用sift.compute()计算关键点描述符,方便后期的特征匹配
kp, des = sift.compute(img, kp)
print(np.array(kp).shape, des.shape)
for i in kp:
    print(i.pt)

输出:

  • 利用kp中的pt属性,获取每个关键点的坐标
相关推荐
x_yeyue10 分钟前
三角形数
笔记·算法·数论·组合数学
薛定猫AI14 分钟前
【深度解析】Gemini Omni 多模态生成与 Agent 化创作工作流:从视频编辑到 UI 生成的技术演进
人工智能·ui·音视频
羊羊小栈15 分钟前
AI赋能电力巡检:智能故障预警系统
人工智能·yolo·目标检测·毕业设计·大作业
Python私教20 分钟前
视觉 Agent 爬取 vs Playwright 脚本:Browser Use 2026 选型表
人工智能
Python私教23 分钟前
Crawlee StagehandCrawler:自然语言点 Load More 的工程化爬虫
人工智能
南屹川24 分钟前
【容器化】Docker实战:从入门到生产环境部署
人工智能
海蓝可知天湛1 小时前
Agent&IELTS雅思口语专属语料库
人工智能·github·rag·ielts·skills
憧憬成为java架构高手的小白1 小时前
docker学习笔记(基于b站多个视频学习)【未完结】
笔记·学习
随身数智备忘录1 小时前
什么是设备管理体系?设备管理体系包含哪些核心模块?
网络·数据库·人工智能
OpenBayes贝式计算1 小时前
涵盖 OCR 与多轮对话:1.3B 端侧多模态模型 MiniCPM-V-4.6 正式发布;百万级智能体数据集 AgentTrove 开源!包含代码修复及数学求解
人工智能