OpenCV 玩转图像和视频

为什么学OpenCV?

• OpenCV ⽀持对图像缩放、旋转、绘制⽂字图形等基础操作

• OpenCV 库包含了很多计算机视觉领域常⻅算法:⽬标检测、⽬标跟踪等

OpenCV 简介

• OpenCV (Open Source Computer Vision) 是计算机视觉和机器学习软件库

• Intel 1999年 创建,⽤C++语⾔编写(提供了Python、Ruby、MATLAB等接⼝)

• 安装 OpenCV
• OpenCV 读取、缩放、翻转、写⼊图像
• OpenCV 在图像上绘制⽂字、⼏何图形
• OpenCV 视频操作

安装:

conda install -c conda-forge opencv

conda install opencv(换源后)

pip install opencv-python

检查是否安装成功:

$ Python

>>> import cv2

>>> cv2.version

'4.5.4'

Notebook 演示

OpenCV 基本处理

导入相关的库

python 复制代码
import numpy as np
import pandas as pd
import cv2
import matplotlib.pyplot as plt
%matplotlib inline

查看opencv的版本

python 复制代码
cv2.__version__

读取照片

python 复制代码
img = cv2.imread("./img/cat.jpg") #即使图片的路径不存在也不会进行报错

展示图片

python 复制代码
plt.imshow(img)

图片的存取的形式

opencv B G R

matplotlib R G B

将opencv转化为matplotlib的形式

python 复制代码
img_fixed = cv2.cvtColor(img,cv2.COLOR_BGR2RGB)

灰度图的形式展现

python 复制代码
plt.imshow(img_gray,cmap="gray")

改变img的大小

python 复制代码
img_resize = cv2.resize(img_fixed,(1000,300))

图像的翻转

python 复制代码
#0代表垂直翻转,1代表水平翻转,-1水平垂直都翻转
img_flip = cv2.flip(img_fixed,-1)

将RGB转化为BGR的格式

python 复制代码
img_save = cv2.cvtColor(img_flip,cv2.COLOR_RGB2BGR) #将RGB转化为BGR的格式

保存BGR形式的图片

python 复制代码
cv2.imwrite('./img_flip.jpg',img_save)

opencv 绘制文字和几何图形

导入包

python 复制代码
# 导入包
import cv2
import numpy as np
import matplotlib.pyplot as plt
from PIL import Image
from PIL import ImageDraw
from PIL import ImageFont
%matplotlib inline

创建一个空白的图像

python 复制代码
black_img = np.zeros(shape = (800,800,3),dtype = np.int16)

查看空白图像的类型

python 复制代码
black_img.shape

展示图片

python 复制代码
plt.imshow(black_img)

使用opencv画矩形

python 复制代码
# 使用opencv画矩形
cv2.rectangle(img = black_img,pt1 = (100,100),pt2 = (400,300),color = (0,255,0),thickness = 10)
python 复制代码
# 使用opencv画矩形
cv2.rectangle(img = black_img,pt1 = (100,100),pt2 = (400,300),color = (0,255,0),thickness = 10)

使用opencv画一个圆

python 复制代码
# 利用opencv画一个圆
cv2.circle(img = black_img,center=(400,400),radius = 100,color=(0,0,255),thickness = 10)
python 复制代码
# 画一个实心的圆
cv2.circle(img = black_img,center=(400,600),radius = 100,color=(0,0,255),thickness = -1)

opencv画一条线

python 复制代码
# opencv 画一条线
cv2.line(img=black_img,pt1=(0,0),pt2=(800,800),color=(255,0,255),thickness=10)

opencv添加一段文字

python 复制代码
# opencv添加一段文字
font = cv2.FONT_HERSHEY_PLAIN#导入字体
cv2.putText(img=black_img,text="python",org=(500,150),fontFace=font,fontScale=4,color=(255,0,255),thickness=5,lineType=cv2.LINE_AA)

opencv画多边形

python 复制代码
#利用opencv画多边形
black_img = np.zeros(shape=(800,800,3),dtype=np.int16)
points = np.array([[400,100],[200,300],[400,700],[600,300]],dtype=np.int32)
pts = points.reshape(-1,1,2)
cv2.polylines(img=black_img,pts=[pts],isClosed=True,color=(255,0,0),thickness=10,lineType=cv2.LINE_AA)
plt.imshow(black_img)

注意opencv画图形是在opencv图像上画的(也就是BGR的形式)

opencv的小例子

demo1.py

python 复制代码
"""
opencv显示图像
"""

# 导入opencv
import cv2
import numpy as np

# 读取图片
img = cv2.imread("./img/cat.jpg")

# 显示图片
# cv2.imshow('Demo',img)]

while True:
    # 一直显示
    cv2.imshow('Demo', img)

    # 如果等待至少10ms,并且用户按了ESC键(ord('q))
    if cv2.waitKey(10) & 0xFF == ord('q'):
    # if cv2.waitKey(10) & oxFF == 27:
        break

# 关闭所有的窗口
cv2.destroyAllWindows()

demo2.py

python 复制代码
"""
OpenCV读取摄像头视频流,并显示
类似demo1.py中的显示图片
"""

# 导入OpenCV
import cv2

# 使用VideoCapture,读取默认摄像头,后面的数字表示摄像头的编号,如果有多个摄像头可以换成其他数字
cap = cv2.VideoCapture(0)

# 再使用cap.read()读取视频流,类似照片,他会以一帧帧的图片返回,所以我们需要用一个循环语句来一直获取
while True:
    # 返回的是元组
    ret,frame = cap.read() #frame就是一帧帧的图片

    # 这里可以把frame 就当成图片来处理
    # 镜像
    frame = cv2.flip(frame,1)
    # 颜色变为灰度
    gray = cv2.cvtColor(frame,cv2.COLOR_BGR2GRAY)

    # 显示图像
    cv2.imshow('demo',gray)

    # 退出条件: ESC
    if cv2.waitKey(10) & 0xFF == 27:
        break

cap.release()
cv2.destroyAllWindows()
    

demo3.py

python 复制代码
"""
OpenCV读取摄像头视频流,并存储为MP4文件
"""

# 导入OpenCV
import cv2

# 读取默认摄像头
cap = cv2.VideoCapture(0)

 
# https://docs.opencv.org/4.x/dd/d43/tutorial_py_video_display.html
# 

fps = 20
width = int( cap.get(cv2.CAP_PROP_FRAME_WIDTH))
height = int( cap.get(cv2.CAP_PROP_FRAME_HEIGHT)) 

# 这里使用OpenCV的VideoWriter方法来,我们看一下官网他是如何使用的
# 可以看到第一个参数是文件名,然后是fourcc编码,然后是FPS帧率,再是画面大小
# 这里需要注意的是Fourcc编码,我们再看一下文档,可以看到
# Windows系统建议用DIVX编码
# macOS系统建议永MJPG、DIVX、X264
# 推荐用 X264、DIVX,一般macOS和Windows都试用
# 写法需要注意*'X264'
#

# FPS 帧率一般根据摄像头的帧率来填写,比如我的是20
# 高度、宽度可以自定义,不过我们也可以直接和原画面一样,使用cap.get方法获取

writer = cv2.VideoWriter('./myDemoVideo.mp4',cv2.VideoWriter_fourcc(*'X264'),fps,(width,height))

while True:
    # 读取视频
    ret,frame = cap.read()
    
    
    # 这里可以把frame 就当成图片来处理
    # 镜像
    frame = cv2.flip(frame,1)
    gray = cv2.cvtColor(frame,cv2.COLOR_BGR2GRAY)
    
    # 写入画面
    writer.write(frame)

    # 显示图像
    cv2.imshow('demo',gray)

    # 退出条件: ESC
    if cv2.waitKey(10) & 0xFF == 27:
        break
    
# 释放句柄    
writer.release()
cap.release()
cv2.destroyAllWindows()
    

demo4.py

python 复制代码
"""
OpenCV读取mp4视频文件
"""

# 导入OpenCV
import cv2
import time

# 还是使用cv2.VideoCapture,只不过参数可以换成文件名,我们读取前面保存的MP4视频
cap = cv2.VideoCapture('./vedio/myDemoVideo.mp4')

# 首先加一个判断,如果文件不存在或编码错误提示
if not cap.isOpened():
    print('文件不存在或编码错误')

while cap.isOpened():
    # 读取帧
    
    ret,frame = cap.read() #retbool判断是否读取成功

    if ret:
        # 显示
        cv2.imshow('demo',frame)

        # 降低显示速度(不加这行会显示得特别快)
        time.sleep(1/20)

        if cv2.waitKey(1) & 0xFF == ord('q'):
            break

    else:
        break


cap.release()
cv2.destroyAllWindows()

demo5.py

python 复制代码
"""
Opencv在视频流上添加文字和图形
"""
# 导入Opencv模块
import cv2
import numpy as np
import time

#导入自定义模块
import drawUtils

#读取摄像头
cap = cv2.VideoCapture(0)

# 当前时间Unix时间戳
start_time = time.time()

while True:
    ret,frame = cap.read()#frame其实就是一帧帧的画面

    #对frame进行操作
    frame = cv2.flip(frame,1)#绕y轴旋转

    #print(type(frame))#打印frame的类型



    #画一个矩形
    cv2.rectangle(frame,(20,200),(120,300),(255,0,255),10)
    now = time.time()#当前时间
    fps_text = int(1/(now -start_time))#帧率,每秒处理的图片数量
    start_time = now#开始时间重新归零

    print(fps_text)

    frame_text = "帧率:" + str(fps_text)

    #显示帧率
    frame = drawUtils.cv2AddChineseText(frame,frame_text,(20,50),(0,255,255),30)
    #显示画面
    cv2.imshow('Demo',frame)
     
    #退出条件
    if cv2.waitKey(10) & 0xFF == 27:
        break

cap.release()
cv2.destroyAllWindows()
相关推荐
qzhqbb1 小时前
基于统计方法的语言模型
人工智能·语言模型·easyui
冷眼看人间恩怨1 小时前
【话题讨论】AI大模型重塑软件开发:定义、应用、优势与挑战
人工智能·ai编程·软件开发
2401_883041081 小时前
新锐品牌电商代运营公司都有哪些?
大数据·人工智能
AI极客菌2 小时前
Controlnet作者新作IC-light V2:基于FLUX训练,支持处理风格化图像,细节远高于SD1.5。
人工智能·计算机视觉·ai作画·stable diffusion·aigc·flux·人工智能作画
阿_旭2 小时前
一文读懂| 自注意力与交叉注意力机制在计算机视觉中作用与基本原理
人工智能·深度学习·计算机视觉·cross-attention·self-attention
王哈哈^_^2 小时前
【数据集】【YOLO】【目标检测】交通事故识别数据集 8939 张,YOLO道路事故目标检测实战训练教程!
前端·人工智能·深度学习·yolo·目标检测·计算机视觉·pyqt
Power20246663 小时前
NLP论文速读|LongReward:基于AI反馈来提升长上下文大语言模型
人工智能·深度学习·机器学习·自然语言处理·nlp
数据猎手小k3 小时前
AIDOVECL数据集:包含超过15000张AI生成的车辆图像数据集,目的解决旨在解决眼水平分类和定位问题。
人工智能·分类·数据挖掘
好奇龙猫3 小时前
【学习AI-相关路程-mnist手写数字分类-win-硬件:windows-自我学习AI-实验步骤-全连接神经网络(BPnetwork)-操作流程(3) 】
人工智能·算法
沉下心来学鲁班4 小时前
复现LLM:带你从零认识语言模型
人工智能·语言模型