计算机视觉cv2入门之视频处理

在我们进行计算机视觉任务时,经常会对视频中的图像进行操作,这里我来给大家分享一下,cv2对视频文件的操作方法。这里我们主要介绍cv2.VideoCapture函数的基本使用方法。

cv2.VideoCapture函数

当我们在使用cv2.VideoCapture函数时,我们通常使用轮询的方式,即:

python 复制代码
while True:
    if condition1:
        do something
    if condition2:
        break
    ...

更一般化的是

python 复制代码
import cv2
#这里是获取实时视频源,如果是读取已有视频文件cap=cv2.VideoCapture(filename='')
cap=cv2.VideoCapture(index=0)
if cap.isOpened():
    while True:
        ret,frame=cap.read()
        #...
        #... 针对视频中的每一帧图像的其他操作
        #....
        if not ret:
            break
        cv2.imshow('test',frame)
        key=cv2.waitKey(1)
        if key==27:#置顶一个按键来结束循环,这里使用esc健的ASCII码
            break
    cap.release()
    cv2.destroyAllWindows()
else:
    print('摄像头未打开')

初始化

视频文件

如果你需要处理的是已有的视频文件,而不是打开摄像头捕获的实时视频流,那么只需要传入filename即可。apiPerference是可选参数主要用来指定视频捕获的后端,即使用哪种顶层API来读取视频流或摄像头,默认值是cv2.CAP_ANY由opencv自动选择

python 复制代码
import cv2
'''
filename:视频文件路径 .mp4
apiPerference:指定视频捕获的后端(即使用哪种底层API来读取视频流或摄像头)

apiPerference参数常用flag:
cv2.CAP_ANY:	自动选择默认后端(OpenCV自行决定)跨平台
cv2.CAP_ANDROID:  使用Android的Camera2 API
cv2.CAP_DSHOW:	使用DirectShow(Windows专用)
cv2.CAP_MSMF:    使用Microsoft Media Foundation(Windows 10+)
cv2.CAP_V4L2:    使用Video4Linux2(Linux专用)Linux
cv2.CAP_FFMPEG:	 使用FFmpeg解码视频文件跨平台(需安装 FFmpeg)
cv2.CAP_GSTREAMER:	使用 GStreamer(Linux常用)
cv2.CAP_OPENNI:	用于深度摄像头(如Kinect)特定设备
'''
cap=cv2.VideoCapture(r'test.mp4')

实时视频流

如果你处理的是实时视频流,那么需要设置index参数,不使用外接设备时index一般都设置为apiPerference是可选参数主要用来指定视频捕获的后端,即使用哪种顶层API来读取视频流或摄像头,默认值是cv2.CAP_ANY由opencv自动选择

python 复制代码
import cv2
'''
index:0或1,0是电脑内置摄像头,1是外接摄像头,没有外接摄像头仍然设置Index=1的话不会报错,只是代码不运行
apiPerference:指定视频捕获的后端(即使用哪种底层API来读取视频流或摄像头)

apiPerference参数常用flag:
cv2.CAP_ANY:	自动选择默认后端(OpenCV自行决定)跨平台
cv2.CAP_ANDROID:  使用Android的Camera2 API
cv2.CAP_DSHOW:	使用DirectShow(Windows专用)
cv2.CAP_MSMF:    使用Microsoft Media Foundation(Windows 10+)
cv2.CAP_V4L2:    使用Video4Linux2(Linux专用)Linux
cv2.CAP_FFMPEG:	 使用FFmpeg解码视频文件跨平台(需安装 FFmpeg)
cv2.CAP_GSTREAMER:	使用 GStreamer(Linux常用)
cv2.CAP_OPENNI:	用于深度摄像头(如Kinect)特定设备
'''
cap=cv2.VideoCapture(index=1,apiPreference=cv2.CAP_ANY)

常用属性

cap.isOpened()

检查视频源是否打开,返回值为True 或False

python 复制代码
import cv2
cap=cv2.VideoCapture(index=0,apiPreference=cv2.CAP_MSMF)
if cap.isOpened():
    print('摄像头已打开')
    while True:
        ret,frame=cap.read()
        cv2.imshow('test',frame)
        key=cv2.waitKey(1)
        if key==27:#按下esc健退出
            break
    cap.release()
    cv2.destroyAllWindows()
else:
    print('摄像头未打开')

cap.read()

用来读取视频中的下一帧,返回值为(ret,frame) ret为是否成功,frame为图像数据

cap.read()是我们处理视频文件中最关键的函数,如果没有这一步,那么根本无法处理视频文件中的图像。

python 复制代码
import cv2
cap=cv2.VideoCapture(index=0,apiPreference=cv2.CAP_MSMF)
if cap.isOpened():
    print('摄像头已打开')
    while True:
        ret,frame=cap.read()
        if not ret:
            break
        cv2.imshow('test',frame)
        key=cv2.waitKey(1)
        if key==27:#按下esc健退出
            break
    cap.release()
    cv2.destroyAllWindows()
else:
    print('摄像头未打开')

cap.release()

用来释放视频源,出现在cv2.destroyAllWindows()前。

python 复制代码
import cv2
#这里是获取实时视频源,如果是读取已有视频文件cap=cv2.VideoCapture(filename='')
cap=cv2.VideoCapture(index=0)
if cap.isOpened():
    while True:
        ret,frame=cap.read()
        #...
        #...
        #....
        cv2.imshow('test',frame)
        key=cv2.waitKey(1)
        if key==27:#设定一个按键来结束循环,这里使用esc健的ASCII码
            break
    cap.release()
    cv2.destroyAllWindows()
else:
    print('摄像头未打开')

视频属性控制

cap.get(propId)

用来获取当前视频的属性值,比如帧宽,高,FPS等。

这里我们以获取当前帧率并标记在窗口内为例:

python 复制代码
fps=cv2.get(cv2.CAP_PROP_FPS)

fps的类型为Float

python 复制代码
import cv2
#这里是获取实时视频源,如果是读取已有视频文件cap=cv2.VideoCapture(filename='')
cap=cv2.VideoCapture(index=0)
if cap.isOpened():
    while True:
        ret,frame=cap.read()
        fps=cap.get(cv2.CAP_PROP_FPS)
        #...
        #...
        #....
        cv2.putText(img=frame,text=f'fps:{fps}',org=(50,50),fontFace=1,fontScale=3,color=(255,0,0))
        cv2.imshow('test',frame)
        key=cv2.waitKey(1)
        if key==27:#设定一个按键来结束循环关闭摄像头,这里使用esc健的ASCII码
            break
    cap.release()
    cv2.destroyAllWindows()
else:
    print('摄像头未打开')

最后,我将所有的本文所有的要点都总结在了下方这个表格里。

参数/方法​ ​说明​
​初始化​
cap=cv2.VideoCapture() 创建视频捕获对象,参数可以是设备索引(摄像头)或视频文件路径。
​常用属性​
cap.isOpened() 检查视频源是否成功打开,返回 True/False
cap.read() 读取下一帧,返回 (ret, frame)ret 为是否成功,frame 为图像数据。
cap.release() 释放视频源。
​视频属性控制​
cap.get(propId) 获取视频属性值(如帧宽、高、FPS 等),propId 为属性标识。
cap.set(propId, value) 设置视频属性值(部分属性可修改)。
​常用属性标识(propId)​
cv2.CAP_PROP_FRAME_WIDTH 帧的宽度(像素)。
cv2.CAP_PROP_FRAME_HEIGHT 帧的高度(像素)。
cv2.CAP_PROP_FPS 视频的帧率(Frames Per Second)。
cv2.CAP_PROP_FRAME_COUNT 视频的总帧数(仅对文件有效)。
cv2.CAP_PROP_POS_MSEC 当前帧的时间戳(毫秒,仅对文件有效)。
cv2.CAP_PROP_POS_FRAMES 当前帧的索引(从 0 开始)。
​其他方法​
cap.grab() 快速抓取下一帧(不解码),通常与 cap.retrieve() 配合使用。
cap.retrieve() 解码并返回由 grab() 抓取的帧。
cap.getBackendName() 返回当前使用的后端名称(如 FFMPEGDSHOW)
相关推荐
AI智能科技用户7946329785 分钟前
okcc呼叫中心两个sip对接线路外呼任务怎么设置才能一个任务对应yigesip中继?
人工智能·后端
火山引擎边缘云11 分钟前
开启报名!火山引擎 x PICO-全国大学生物联网设计竞赛赛题发布
人工智能·物联网·aigc
机器学习Zero15 分钟前
自然语言处理(9)—— 共现词矩阵及Python实现
人工智能·python·自然语言处理·nlp
Json_15 分钟前
睡前小故事数据集分享
人工智能·数据分析·openai
墨顿17 分钟前
模型推理的性能优化
人工智能·深度学习·性能优化·模型推理
萧门竹巷26 分钟前
看到的都惊了!AI 工具集
人工智能
大有数据可视化27 分钟前
智慧城市:如同为城市装上智能大脑,开启智慧生活
人工智能·生活·智慧城市
活力板蓝根33 分钟前
QQ音乐的 AI 化转型范本:一款音乐 App 如何用大模型重构听歌体验?
人工智能·音视频·娱乐·用户体验
闭月之泪舞1 小时前
OpenCv高阶(六)——图像的透视变换
人工智能·opencv·计算机视觉
掘金安东尼1 小时前
以一敌百:没有 Infra 团队,那就打造自己的技术雷达
人工智能·github