1.1 OpenCV随手简记(一)

OpenCV学习篇

OpenCV (Open Source Computer Vision Library) 是一个开源的计算机视觉库,它提供了大量的算法和函数,用于图像处理、计算机视觉和机器学习等领域。

1. OpenCV 简介

1.1 OpenCV 的起源和发展

OpenCV 项目始于 1999 年,由 Intel 公司发起,旨在为计算机视觉研究人员和开发者提供一个开源的库。经过多年的发展,OpenCV 已经成为最流行的计算机视觉库之一,被广泛应用于学术研究和工业应用中。

1.2 OpenCV 的特点和优势

  • 开源免费:OpenCV 是开源的,可以免费使用和修改。
  • 跨平台:OpenCV 支持多种操作系统,包括 Windows、Linux、Mac OS 等。
  • 功能丰富:OpenCV 提供了大量的图像处理、计算机视觉和机器学习算法,涵盖了从基础到高级的各种功能。
  • 易于使用:OpenCV 的 API 设计简洁易懂,易于学习和使用。

2. OpenCV 安装和配置

2.1 OpenCV 安装

OpenCV 可以通过多种方式安装,包括预编译的二进制包、源代码编译以及使用包管理工具(如 pip)安装。

2.2 OpenCV 配置

安装 OpenCV 后,需要配置开发环境,包括添加库路径、头文件路径等。

3. OpenCV 基础

3.1 图像读取和显示

  • cv2.imread():读取图像文件。
  • cv2.imshow():显示图像。
  • cv2.waitKey():等待按键事件。

3.2 图像基础操作

  • cv2.cvtColor():图像颜色空间转换。
  • cv2.resize():图像缩放。
  • cv2.copyMakeBorder():图像边界扩展。
  • cv2.split()cv2.merge():图像通道分离和合并。

3.3 图像滤波

  • cv2.blur():均值滤波。
  • cv2.GaussianBlur():高斯滤波。
  • cv2.medianBlur():中值滤波。
  • cv2.bilateralFilter():双边滤波。

3.4 图像边缘检测

  • cv2.Canny():Canny 边缘检测算法。
  • cv2.Sobel():Sobel 算子。
  • cv2.Laplacian():Laplacian 算子。

3.5 图像形态学操作

  • cv2.erode():腐蚀操作。
  • cv2.dilate():膨胀操作。
  • cv2.morphologyEx():形态学操作(开运算、闭运算等)。

4. OpenCV 进阶

4.1 特征检测与匹配

  • cv2.goodFeaturesToTrack():角点检测。
  • cv2.SIFT()cv2.SURF()cv2.ORB():特征点检测和描述。
  • cv2.BFMatcher()cv2.FlannBasedMatcher():特征匹配。

4.2 轮廓检测

  • cv2.findContours():寻找图像中的轮廓。
  • cv2.drawContours():绘制轮廓。

4.3 图像分割

  • cv2.threshold():图像阈值分割。
  • cv2.watershed():分水岭算法。

4.4 联通组件分析

  • cv2.connectedComponents():连通组件分析。

4.5 目标跟踪

  • cv2.TrackerMIL_create():多实例学习跟踪器。
  • cv2.TrackerKCF_create():核相关滤波跟踪器。

5. OpenCV 应用

5.1 人脸检测

人脸检测是计算机视觉中的一个经典问题,它可以帮助我们识别图像或视频中的 faces。OpenCV 提供了级联分类器(Cascade Classifier)用于人脸检测。

  • 级联分类器:级联分类器是一种基于机器学习的分类器,它由多个简单的分类器级联而成。每个分类器负责检测图像中的某个局部特征,如果所有分类器都认为该区域是人脸,则最终判断该区域为人脸。

  • HAAR 特征:HAAR 特征是一种用于图像分类的特征,它基于图像的灰度差。OpenCV 提供了 HAAR 特征的训练工具,可以帮助您训练自己的人脸检测模型。

  • 示例代码*

    # 创建级联分类器对象
    face_cascade = cv2.CascadeClassifier('haarcascade_frontalface_default.xml')
    # 读取图像
    img = cv2.imread('image.jpg')
    # 将图像转换为灰度图
    gray = cv2.cvtColor(img, cv2.COLOR_BGR2GRAY)
    # 检测图像中的人脸
    faces = face_cascade.detectMultiScale(gray, scaleFactor=1.1, minNeighbors=5, minSize=(30, 30), maxSize=(100, 100))
    # 绘制人脸矩形框
    for (x, y, w, h) in faces:
       cv2.rectangle(img, (x, y), (x+w, y+h), (255, 0, 0), 2)
    # 显示图像
    cv2.imshow('Image', img)
    cv2.waitKey(0)
    cv2.destroyAllWindows()
    

5.2 车牌识别

车牌识别是计算机视觉中的一个重要应用,它可以用于交通监控、智能停车等领域。OpenCV 提供了多种工具和算法,可以帮助您实现车牌识别。

  • 轮廓检测 :使用 cv2.findContours() 函数可以检测图像中的轮廓,从而找到车牌区域。

  • 模板匹配 :使用 cv2.matchTemplate() 函数可以将车牌模板与图像中的区域进行匹配,从而识别车牌。

  • 字符识别:可以使用 Tesseract OCR 库或其他字符识别算法识别车牌中的字符。

  • 示例代码*

    # 读取图像
    img = cv2.imread('image.jpg')
    # 将图像转换为灰度图
    gray = cv2.cvtColor(img, cv2.COLOR_BGR2GRAY)
    # 使用 Sobel 算子进行边缘检测
    edges = cv2.Canny(gray, 50, 150, apertureSize=3)
    # 查找轮廓
    contours, hierarchy = cv2.findContours(edges, cv2.RETR_TREE, cv2.CHAIN_APPROX_SIMPLE)
    # 绘制轮廓
    cv2.drawContours(img, contours, -1, (0, 255, 0), 3)
    # 显示图像
    cv2.imshow('Image', img)
    cv2.waitKey(0)
    cv2.destroyAllWindows()
    

    5.3 物体识别

  • 物体识别是计算机视觉中的一个重要应用,它可以用于智能监控、智能交通等领域。OpenCV 提供了多种工具和算法,可以帮助您实现物体识别。

  • 支持向量机 (SVM):SVM 是一种用于分类的机器学习算法,它可以用于识别图像中的物体。

  • HOG 描述子:HOG 描述子是一种用于图像特征提取的算法,它可以用于描述图像中的物体形状。

  • 示例代码*

    # 创建 SVM 分类器
    svm = cv2.ml.SVM_create()
    # 训练 SVM 分类器
    svm.train(train_data, cv2.ml.ROW_SAMPLE, labels)
    # 使用 SVM 分类器识别图像中的物体
    rects, labels = svm.detectMultiScale(img, scaleFactor=1.05, minNeighbors=3, minSize=(30, 30))
    # 绘制识别结果
    for (x, y, w, h) in rects:
       cv2.rectangle(img, (x, y), (x+w, y+h), (0, 255, 0), 2)
    # 显示图像
    cv2.imshow('Image', img)
    cv2.waitKey(0)
    cv2.destroyAllWindows()
    

5.4 视频分析

视频分析是计算机视觉中的一个重要应用,它可以用于运动检测、目标跟踪、行为识别等领域。OpenCV 提供了多种工具和算法,可以帮助您实现视频分析。

  • 视频读取 :使用 cv2.VideoCapture() 函数可以读取视频文件。

  • 视频写入 :使用 cv2.VideoWriter() 函数可以将视频写入文件。

  • 背景减除器 :使用 cv2.createBackgroundSubtractorMOG2() 函数可以创建背景减除器,用于检测视频中的运动目标。

  • 示例代码*

    # 创建 VideoCapture 对象
    cap = cv2.VideoCapture('video.mp4')
    # 创建 BackgroundSubtractorMOG2 对象
    fgbg = cv2.createBackgroundSubtractorMOG2()
    # 读取视频帧
    while True:
       ret, frame = cap.read()
       if not ret:
           break
       # 应用背景减除器
       fgmask = fgbg.apply(frame)
       # 显示前景掩码
       cv2.imshow('Foreground Mask', fgmask)
       # 按 'q' 键退出循环
       if cv2.waitKey(1) & 0xFF == ord('q'):
           break
    # 释放 VideoCapture 对象
    cap.release()
    # 关闭所有窗口
    cv2.destroyAllWindows()
    

6. OpenCV 扩展

6.1 DNN 模块

OpenCV 的 DNN (Deep Neural Network) 模块提供了深度学习相关的功能,可以用于图像分类、目标检测、语义分割等任务。

  • 模型加载 :使用 cv2.dnn.readNetFromDarknet()cv2.dnn.readNetFromTensorflow() 等函数可以加载不同的深度学习模型。

  • 模型推理 :使用 cv2.dnn Net::forward() 函数可以对图像进行模型推理,获取模型的输出结果。

  • 示例代码*

    # 创建网络对象
    net = cv2.dnn.readNetFromDarknet('yolov3.cfg')
    # 加载权重文件
    net.setPreferableBackend(cv2.dnn.DNN_BACKEND_OPENCV)
    net.setPreferableTarget(cv2.dnn.DNN_TARGET_CPU)
    # 读取图像
    img = cv2.imread('image.jpg')
    # 获取网络输入尺寸
    blob = cv2.dnn.blobFromImage(img, scalefactor=1/255, size=(416,416), mean=(0,0,0), swapRB=True, crop=False)
    # 设置网络输入
    net.setInput(blob)
    # 执行模型推理
    outputs = net.forward()
    # 处理模型输出结果
    ...
    

6.2 ML模块

OpenCV 的 ML (Machine Learning) 模块提供了机器学习相关的功能,可以用于分类、回归、聚类等任务。

  • SVM:支持向量机 (SVM) 是一种用于分类的机器学习算法。

  • KNN:K 近邻 (KNN) 是一种用于分类和回归的机器学习算法。

  • 决策树:决策树是一种用于分类和回归的机器学习算法。

  • 示例代码*

    ## 创建 SVM 分类器
    svm = cv2.ml.SVM_create()
    ## 设置 SVM 参数
    svm.setType(cv2.ml.SVM_C_SVC)
    svm.setKernel(cv2.ml.SVM_LINEAR)
    svm.setTermCriteria((cv2.TERM_CRITERIA_MAX_ITER, 100, 1e-6))
    ## 训练 SVM 分类器
    svm.train(train_data, cv2.ml.ROW_SAMPLE, labels)
    ## 使用 SVM 分类器进行预测
    ret, result = svm.predict(test_data)
    ## 输出预测
    

7. OpenCV 学习资源

相关推荐
成富1 小时前
文本转SQL(Text-to-SQL),场景介绍与 Spring AI 实现
数据库·人工智能·sql·spring·oracle
凤枭香1 小时前
Python OpenCV 傅里叶变换
开发语言·图像处理·python·opencv
CSDN云计算1 小时前
如何以开源加速AI企业落地,红帽带来新解法
人工智能·开源·openshift·红帽·instructlab
艾派森1 小时前
大数据分析案例-基于随机森林算法的智能手机价格预测模型
人工智能·python·随机森林·机器学习·数据挖掘
hairenjing11231 小时前
在 Android 手机上从SD 卡恢复数据的 6 个有效应用程序
android·人工智能·windows·macos·智能手机
小蜗子1 小时前
Multi‐modal knowledge graph inference via media convergenceand logic rule
人工智能·知识图谱
SpikeKing2 小时前
LLM - 使用 LLaMA-Factory 微调大模型 环境配置与训练推理 教程 (1)
人工智能·llm·大语言模型·llama·环境配置·llamafactory·训练框架
黄焖鸡能干四碗2 小时前
信息化运维方案,实施方案,开发方案,信息中心安全运维资料(软件资料word)
大数据·人工智能·软件需求·设计规范·规格说明书
2 小时前
开源竞争-数据驱动成长-11/05-大专生的思考
人工智能·笔记·学习·算法·机器学习
ctrey_2 小时前
2024-11-4 学习人工智能的Day21 openCV(3)
人工智能·opencv·学习