【OpenCV】实时屏幕捕获

文章目录

前言

日常中如果需要进行大数据分析,那么就要记录用户的使用情况和数据分析。

实时屏幕捕获就可以很好地获取数据,从而进行数据分析和使用习惯。

借助AI模拟人为操作习惯,替代重复性工作解放咱们的双手。

训练AI来模拟人为操作,就需要先看着其工作,然后进行学习,就类似于学徒跟着师傅学习,首先要先看着,然后慢慢尝试,师傅再矫正,直到可以和师傅一样工作,当然唯一不可替代的是人的思维、创造力、想象力。

如何使用 OpenCV 展示实时屏幕捕获,这是模拟人为操作的基础步骤之一。

基本思路

  1. 利用 pyautogui 来监控人为在电脑上面的操作画面
  2. 利用 numpy 来实时解析并转换画面的数据
  3. 利用 OpenCV 图像处理工具来实时处理画面。

安装依赖包

首先,我们需要安装所需的库。在终端或命令提示符中执行以下命令:

shell 复制代码
pip install opencv-python pyautogui numpy

opencv-python:用于提供了丰富的图像处理和计算机视觉算法

pyautogui:用于控制鼠标和键盘,从而模拟人的操作

numpy:用于处理大型多维数组和矩阵,以及执行与数据结构相关的数学运算

实时捕获屏幕画面

利用 pyautogui 工具来实时捕获电脑屏幕:

python 复制代码
import pyautogui

# 设置捕获电脑区域
monitor = (0, 0, 1920, 1080)

# 设置捕获对象
screenshot = pyautogui.screenshot(region=monitor)

转换屏幕画面数据

利用 numpy 实时高效转换捕获屏幕的数据:

python 复制代码
import numpy as np

screenshot_np = np.array(screenshot)

调用窗体显示屏幕截取画面

利用 cv2 调用窗体并显示屏幕截取画面:

python 复制代码
import cv2

# 创建 windows 窗体
cv2.namedWindow("Real-time Screen Capture", cv2.WINDOW_NORMAL)

# 将 BGR 转换为 RGB (OpenCV 默认使用 RGB)
screenshot_np = cv2.cvtColor(screenshot_np, cv2.COLOR_BGR2RGB)
cv2.imshow("Real-time Screen Capture", screenshot_np)

增加实时捕获时间

使用 datetime 来获取当前时间,并将其添加到图像中:

python 复制代码
from datetime import datetime

# 获取当前时间
current_time = datetime.now().strftime("%Y-%m-%d %H:%M:%S")

# 在窗口内显示实时时间
cv2.putText(screenshot_np, current_time, (10, 70), cv2.FONT_HERSHEY_SIMPLEX, 0.8, (0, 0, 0), 2, cv2.LINE_AA)

保存实时视频流

要保存视频流,可以使用 OpenCV 的 VideoWriter 类:

python 复制代码
# 视频保存参数
fourcc = cv2.VideoWriter_fourcc(*'XVID')
fps = 25.0
output_size = (1920, 1080)

# 创建 VideoWriter 对象
out = cv2.VideoWriter('screen_capture.avi', fourcc, fps, output_size)

# 将帧写入视频流
out.write(screenshot_np)

保存实时视频流是为了记录人为一系列操作,用于后面分析使用。

效果图

实时屏幕捕获

完整实现代码

python 复制代码
import cv2
import pyautogui
import numpy as np
from datetime import datetime


# 设置捕获电脑区域
monitor = (0, 0, 1920, 1080)

# 视频保存参数
fourcc = cv2.VideoWriter_fourcc(*'XVID')
fps = 25.0
output_size = (1920, 1080)
output_file = 'screen_capture.avi'

# 创建 VideoWriter 对象
out = cv2.VideoWriter(output_file, fourcc, fps, output_size)

# 创建 windows 窗体
cv2.namedWindow("实时屏幕捕获".encode("gbk").decode('UTF-8', errors='ignore'), cv2.WINDOW_NORMAL)

while True:
    
    # 获取当前时间
    current_time = datetime.now().strftime("%Y-%m-%d %H:%M:%S")

    # 设置捕获对象
    screenshot = pyautogui.screenshot(region=monitor)
    screenshot_np = np.array(screenshot)

    # 将 BGR 转换为 RGB (OpenCV 默认使用 RGB)
    screenshot_np = cv2.cvtColor(screenshot_np, cv2.COLOR_BGR2RGB)
    
    # 在窗口内显示实时时间
    cv2.putText(screenshot_np, current_time, (10, 70), cv2.FONT_HERSHEY_SIMPLEX, 0.8, (0, 0, 0), 2, cv2.LINE_AA)

    # 将帧写入视频流
    out.write(screenshot_np)

    # 显示屏幕截取画面
    cv2.imshow("实时屏幕捕获".encode("gbk").decode('UTF-8', errors='ignore'), screenshot_np)

    # 监控按键,按下 q 退出程序
    if cv2.waitKey(1) & 0xFF == ord("q"):
        break

# 关闭 OpenCV 所有窗体
cv2.destroyAllWindows()
相关推荐
某人辛木2 小时前
Web自动化测试
前端·python·pycharm·pytest
C+++Python3 小时前
详细介绍一下Java泛型的通配符
java·windows·python
小帅热爱难回头4 小时前
编写Skill生成AI落地项目系统架构
python
diving deep4 小时前
脚本速览-python
开发语言·python
2601_951643776 小时前
Python第一,Java跌出前三,C语言杀回来了
java·c语言·python·编程语言排行·技术趋势
AC赳赳老秦8 小时前
OpenClaw+Power Apps 实战:自动生成 Power Apps 应用、连接 Excel 数据源
大数据·开发语言·python·serverless·excel·deepseek·openclaw
茉莉玫瑰花茶9 小时前
综合案例 - AI 智能租房助手 [ 5 ]
服务器·数据库·人工智能·python·ai
文艺倾年9 小时前
【强化学习】强化学习基本概念,20W字总结(一)
人工智能·python·语言模型·自然语言处理·面试·职场和发展·大模型
宸丶一9 小时前
Day 13:持久化记忆 - 让 Agent 拥有长期记忆
jvm·python·ai
码云骑士10 小时前
13-列表append的底层真相(上)-listobject源码中的预分配策略
开发语言·python