【OpenCV】实时屏幕捕获

文章目录

前言

日常中如果需要进行大数据分析,那么就要记录用户的使用情况和数据分析。

实时屏幕捕获就可以很好地获取数据,从而进行数据分析和使用习惯。

借助AI模拟人为操作习惯,替代重复性工作解放咱们的双手。

训练AI来模拟人为操作,就需要先看着其工作,然后进行学习,就类似于学徒跟着师傅学习,首先要先看着,然后慢慢尝试,师傅再矫正,直到可以和师傅一样工作,当然唯一不可替代的是人的思维、创造力、想象力。

如何使用 OpenCV 展示实时屏幕捕获,这是模拟人为操作的基础步骤之一。

基本思路

  1. 利用 pyautogui 来监控人为在电脑上面的操作画面
  2. 利用 numpy 来实时解析并转换画面的数据
  3. 利用 OpenCV 图像处理工具来实时处理画面。

安装依赖包

首先,我们需要安装所需的库。在终端或命令提示符中执行以下命令:

shell 复制代码
pip install opencv-python pyautogui numpy

opencv-python:用于提供了丰富的图像处理和计算机视觉算法

pyautogui:用于控制鼠标和键盘,从而模拟人的操作

numpy:用于处理大型多维数组和矩阵,以及执行与数据结构相关的数学运算

实时捕获屏幕画面

利用 pyautogui 工具来实时捕获电脑屏幕:

python 复制代码
import pyautogui

# 设置捕获电脑区域
monitor = (0, 0, 1920, 1080)

# 设置捕获对象
screenshot = pyautogui.screenshot(region=monitor)

转换屏幕画面数据

利用 numpy 实时高效转换捕获屏幕的数据:

python 复制代码
import numpy as np

screenshot_np = np.array(screenshot)

调用窗体显示屏幕截取画面

利用 cv2 调用窗体并显示屏幕截取画面:

python 复制代码
import cv2

# 创建 windows 窗体
cv2.namedWindow("Real-time Screen Capture", cv2.WINDOW_NORMAL)

# 将 BGR 转换为 RGB (OpenCV 默认使用 RGB)
screenshot_np = cv2.cvtColor(screenshot_np, cv2.COLOR_BGR2RGB)
cv2.imshow("Real-time Screen Capture", screenshot_np)

增加实时捕获时间

使用 datetime 来获取当前时间,并将其添加到图像中:

python 复制代码
from datetime import datetime

# 获取当前时间
current_time = datetime.now().strftime("%Y-%m-%d %H:%M:%S")

# 在窗口内显示实时时间
cv2.putText(screenshot_np, current_time, (10, 70), cv2.FONT_HERSHEY_SIMPLEX, 0.8, (0, 0, 0), 2, cv2.LINE_AA)

保存实时视频流

要保存视频流,可以使用 OpenCV 的 VideoWriter 类:

python 复制代码
# 视频保存参数
fourcc = cv2.VideoWriter_fourcc(*'XVID')
fps = 25.0
output_size = (1920, 1080)

# 创建 VideoWriter 对象
out = cv2.VideoWriter('screen_capture.avi', fourcc, fps, output_size)

# 将帧写入视频流
out.write(screenshot_np)

保存实时视频流是为了记录人为一系列操作,用于后面分析使用。

效果图

实时屏幕捕获

完整实现代码

python 复制代码
import cv2
import pyautogui
import numpy as np
from datetime import datetime


# 设置捕获电脑区域
monitor = (0, 0, 1920, 1080)

# 视频保存参数
fourcc = cv2.VideoWriter_fourcc(*'XVID')
fps = 25.0
output_size = (1920, 1080)
output_file = 'screen_capture.avi'

# 创建 VideoWriter 对象
out = cv2.VideoWriter(output_file, fourcc, fps, output_size)

# 创建 windows 窗体
cv2.namedWindow("实时屏幕捕获".encode("gbk").decode('UTF-8', errors='ignore'), cv2.WINDOW_NORMAL)

while True:
    
    # 获取当前时间
    current_time = datetime.now().strftime("%Y-%m-%d %H:%M:%S")

    # 设置捕获对象
    screenshot = pyautogui.screenshot(region=monitor)
    screenshot_np = np.array(screenshot)

    # 将 BGR 转换为 RGB (OpenCV 默认使用 RGB)
    screenshot_np = cv2.cvtColor(screenshot_np, cv2.COLOR_BGR2RGB)
    
    # 在窗口内显示实时时间
    cv2.putText(screenshot_np, current_time, (10, 70), cv2.FONT_HERSHEY_SIMPLEX, 0.8, (0, 0, 0), 2, cv2.LINE_AA)

    # 将帧写入视频流
    out.write(screenshot_np)

    # 显示屏幕截取画面
    cv2.imshow("实时屏幕捕获".encode("gbk").decode('UTF-8', errors='ignore'), screenshot_np)

    # 监控按键,按下 q 退出程序
    if cv2.waitKey(1) & 0xFF == ord("q"):
        break

# 关闭 OpenCV 所有窗体
cv2.destroyAllWindows()
相关推荐
源码之家13 小时前
计算机毕业设计:Python汽车销量数据采集分析可视化系统 Flask框架 requests爬虫 可视化 车辆 大数据 机器学习 hadoop(建议收藏)✅
大数据·爬虫·python·django·flask·课程设计·美食
格林威13 小时前
Baumer相机铝型材表面划伤长度测量:实现损伤量化评估的 5 个关键技术,附 OpenCV+Halcon 实战代码!
开发语言·人工智能·数码相机·opencv·计算机视觉·c#·工业相机
Roselind_Yi13 小时前
【吴恩达2026 Agentic AI】面试向+项目实战(含面试题+项目案例)-2
人工智能·python·机器学习·面试·职场和发展·langchain·agent
2401_8274999913 小时前
python核心语法01-数据存储与运算
java·数据结构·python
一直会游泳的小猫13 小时前
ClaudeCode完整学习指南
python·ai编程·claude code·claude code指南
第一程序员13 小时前
Python与容器化:Docker和Kubernetes实战
python·github
JaydenAI13 小时前
[RAG在LangChain中的实现-04]常用的向量存储和基于向量存储的检索器
python·langchain·ai编程
Roselind_Yi13 小时前
【吴恩达2026 Agentic AI】面试向+项目实战(含面试题+项目案例)-1
人工智能·python·面试·职场和发展·langchain·gpt-3·agent
Alan GEO实施教练14 小时前
专利申请是否找代理机构:核心考量与决策逻辑拆解
大数据·人工智能·python
oyguyteggytrrwwwrt14 小时前
抄写YOLOE源码——先抄写ultralytics包,关于__init__.py
开发语言·python