深度学习篇---Opencv中的机器学习和深度学习


文章目录

  • 前言
  • [一、OpenCV 中的机器学习](#一、OpenCV 中的机器学习)
    • [1. 概述](#1. 概述)
    • [2. 使用步骤](#2. 使用步骤)
      • [步骤 1:准备数据](#步骤 1:准备数据)
      • [步骤 2:创建模型](#步骤 2:创建模型)
      • [步骤 3:训练模型](#步骤 3:训练模型)
      • [步骤 4:预测](#步骤 4:预测)
    • [3. 优点](#3. 优点)
    • [4. 缺点](#4. 缺点)
  • [二、OpenCV 中的深度学习](#二、OpenCV 中的深度学习)
    • [1. 概述](#1. 概述)
      • [图像分类(如 ResNet、MobileNet)](#图像分类(如 ResNet、MobileNet))
      • [目标检测(如 YOLO、SSD)](#目标检测(如 YOLO、SSD))
      • [语义分割(如 DeepLab)](#语义分割(如 DeepLab))
      • [人脸检测(如 OpenFace)](#人脸检测(如 OpenFace))
    • [2. 使用步骤](#2. 使用步骤)
      • [步骤 1:加载模型](#步骤 1:加载模型)
      • [步骤 2:准备输入数据](#步骤 2:准备输入数据)
      • [步骤 3:推理](#步骤 3:推理)
      • [步骤 4:解析结果](#步骤 4:解析结果)
      • [步骤 5:显示结果](#步骤 5:显示结果)
    • [3. 优点](#3. 优点)
    • [4. 缺点](#4. 缺点)
  • 三、机器学习与深度学习的对比
  • 四、总结

前言

OpenCV 是一个开源的计算机视觉库 ,广泛应用于图像处理、视频分析对象检测 等领域。它不仅提供了传统的计算机视觉算法 ,还集成了机器学习和深度学习的功能。以下是对 OpenCV 中机器学习和深度学习的详细介绍,包括使用步骤、优点和缺点。


一、OpenCV 中的机器学习

1. 概述

OpenCV 提供了多种经典的机器学习算法,包括:

  1. 支持向量机 (SVM)
  2. K近邻 (K-Nearest Neighbors, KNN)
  3. 决策树 (Decision Trees)
  4. 随机森林 (Random Forests)
  5. 朴素贝叶斯 (Naive Bayes)
  6. K均值聚类 (K-Means Clustering)
    这些算法可以用于分类、回归、聚类等任务。

2. 使用步骤

SVM 为例 ,介绍 OpenCV 中机器学习的使用步骤:

步骤 1:准备数据

python 复制代码
import cv2
import numpy as np

#创建训练数据
train_data = np.random.randint(0, 100, (20, 2)).astype(np.float32)
labels = np.random.randint(0, 2, (20, 1)).astype(np.float32)

步骤 2:创建模型

python 复制代码
#创建 SVM 模型
svm = cv2.ml.SVM_create()
svm.setKernel(cv2.ml.SVM_LINEAR)  # 设置核函数
svm.setType(cv2.ml.SVM_C_SVC)    # 设置类型为分类

步骤 3:训练模型

bash 复制代码
svm.train(train_data, cv2.ml.ROW_SAMPLE, labels)

步骤 4:预测

bash 复制代码
#创建测试数据
test_data = np.random.randint(0, 100, (5, 2)).astype(np.float32)
#预测
_, result = svm.predict(test_data)
print(result)

3. 优点

简单易用

简单易用:OpenCV 提供了统一的 API,易于上手。

轻量级

轻量级:适合嵌入式设备或资源受限的环境

实时性

实时性:传统机器学习算法通常计算量较小适合实时应用

4. 缺点

特征依赖

特征依赖:需要手动提取特征特征工程的质量直接影响模型性能

性能有限

性能有限:相比深度学习,传统机器学习在处理复杂任务(如图像分类、目标检测)时性能较差。

二、OpenCV 中的深度学习

1. 概述

OpenCV 从 3.1 版本 开始支持深度学习模块(dnn) ,可以加载预训练的深度学习模型(如 TensorFlow、PyTorch、Caffe 等框架训练的模型),并进行推理。支持的模型包括:

图像分类(如 ResNet、MobileNet)

目标检测(如 YOLO、SSD)

语义分割(如 DeepLab)

人脸检测(如 OpenFace)

2. 使用步骤

以 YOLO 目标检测为例,介绍 OpenCV 中深度学习的使用步骤:

步骤 1:加载模型

python 复制代码
import cv2
#加载 YOLO 模型
net = cv2.dnn.readNet("yolov3.weights", "yolov3.cfg")
with open("coco.names", "r") as f:
    classes = f.read().strip().split("\n")

步骤 2:准备输入数据

python 复制代码
#加载图像
image = cv2.imread("image.jpg")
height, width, _ = image.shape

#将图像转换为 blob 格式
blob = cv2.dnn.blobFromImage(image, 1/255.0, (416, 416), swapRB=True, crop=False)
net.setInput(blob)

步骤 3:推理

python 复制代码
#获取输出层
layer_names = net.getLayerNames()
output_layers = [layer_names[i[0] - 1] for i in net.getUnconnectedOutLayers()]

#前向传播
detections = net.forward(output_layers)

步骤 4:解析结果

python 复制代码
for detection in detections:
    for obj in detection:
        scores = obj[5:]
        class_id = np.argmax(scores)
        confidence = scores[class_id]
        if confidence > 0.5:  # 过滤低置信度的检测结果
            # 获取检测框坐标
            center_x, center_y, w, h = (obj[0:4] * np.array([width, height, width, height])).astype("int")
            x = int(center_x - w / 2)
            y = int(center_y - h / 2)
            # 绘制检测框
            cv2.rectangle(image, (x, y), (x + w, y + h), (0, 255, 0), 2)
            # 显示类别和置信度
            label = f"{classes[class_id]}: {confidence:.2f}"
            cv2.putText(image, label, (x, y - 5), cv2.FONT_HERSHEY_SIMPLEX, 0.5, (0, 255, 0), 2)

步骤 5:显示结果

python 复制代码
cv2.imshow("Image", image)
cv2.waitKey(0)
cv2.destroyAllWindows()

3. 优点

高性能

高性能:深度学习模型在复杂任务(如图像分类、目标检测)上表现优异

预训练模型

预训练模型:可以直接加载预训练模型,无需从头训练

跨框架支持

跨框架支持:支持多种深度学习框架的模型

4. 缺点

计算资源要求高

计算资源需求高:深度学习模型通常需要 GPU 加速,对硬件要求较高

训练复杂

训练复杂:OpenCV 的 dnn 模块仅支持推理 ,不支持训练,训练需要在其他框架(如 TensorFlow、PyTorch)中完成。

实时性受限

实时性受限:部分复杂模型(如 YOLOv4、ResNet)在 CPU 上推理速度较慢

三、机器学习与深度学习的对比

特性 机器学习 深度学习
特征提取 需要手动设计 特征 自动学习 特征
性能 适合简单任务 适合复杂任务
计算资源 计算量小,适合 CPU 计算量大,通常需要 GPU
训练数据 数据需求较少 需要大量标注数据
实时性 实时性较好 复杂模型实时性较差
灵活性 灵活性较低 灵活性高,支持多种任务

四、总结

机器学习

机器学习:适合资源受限的场景或简单任务特征工程是关键。

深度学习

深度学习:适合复杂任务,性能优越,但对硬件和数据要求较高

OpenCV 提供了机器学习和深度学习的接口,开发者可以根据具体需求选择合适的工具。


相关推荐
进击切图仔8 小时前
确保深度神经网络在训练过程中的数值稳定性
人工智能·机器学习·dnn
枫叶林FYL8 小时前
项目十一:Saga模式分布式旅行预订系统 核心服务实现与Saga编排器
数据库·python·docker
流浪法师解剖鱼8 小时前
CocosCreator制作推箱子游戏
python·cocos2d
天天代码码天天8 小时前
用 OpenCV 5 DNN 跑 PP-OCR:一个适合新手学习的 C++ 动态库 + C# 可视化测试项目
opencv·ocr·dnn·opencv5·ppocrv6
EQUINOX18 小时前
【论文阅读】| ViT精读
论文阅读·人工智能·深度学习·机器学习
财经资讯数据_灵砚智能8 小时前
基于全球经济类多源新闻的NLP情感分析与数据可视化(夜间-次晨)2026年6月9日
人工智能·python·ai·信息可视化·自然语言处理·ai编程·灵砚智能
仙俊红8 小时前
深入理解 ThreadLocal —— 从变量引用、强弱引用到 Spring Boot 实战
spring boot·python·算法
Dxy12393102168 小时前
Python 请求:为什么 Session 比直接请求快 10 倍?
开发语言·python
The_Ticker8 小时前
港股量化实测:实时行情接口性能与数据质量深度解析
python·websocket·算法·金融
weisian1518 小时前
基础篇--概念原理-25-大模型的剪枝是什么?怎么理解?——从原理到实战,一篇讲透
算法·机器学习·大模型·剪枝