猫狗识别—视频识别

猫狗识别---视频识别

  • [1. 导入所需的库:](#1. 导入所需的库:)
  • [2. 创建Tkinter主窗口并设置标题:](#2. 创建Tkinter主窗口并设置标题:)
  • [3. 设置窗口的宽度和高度:](#3. 设置窗口的宽度和高度:)
  • [4. 创建一个Canvas,它将用于显示视频帧:](#4. 创建一个Canvas,它将用于显示视频帧:)
  • [5. 初始化一个视频流变量cap,用于存储OpenCV的视频捕获对象:](#5. 初始化一个视频流变量cap,用于存储OpenCV的视频捕获对象:)
  • [6. 定义一个函数update_frame,用于更新Canvas上的视频帧。函数实现将在后面解释:](#6. 定义一个函数update_frame,用于更新Canvas上的视频帧。函数实现将在后面解释:)
  • [7. 定义一个函数update_frame,用于更新Canvas上的视频帧。函数实现将在后面解释:](#7. 定义一个函数update_frame,用于更新Canvas上的视频帧。函数实现将在后面解释:)
  • [8. 定义一个函数close,用于退出程序并关闭视频流。函数实现将在后面解释:](#8. 定义一个函数close,用于退出程序并关闭视频流。函数实现将在后面解释:)
  • [9. 创建两个按钮,一个用于选择视频文件,另一个用于退出程序。按钮的图片和位置在这里设置:](#9. 创建两个按钮,一个用于选择视频文件,另一个用于退出程序。按钮的图片和位置在这里设置:)
  • [10. 启动Tkinter的事件循环,这将显示窗口并开始处理用户事件:](#10. 启动Tkinter的事件循环,这将显示窗口并开始处理用户事件:)
  • [11. 完整代码+运行结果:](#11. 完整代码+运行结果:)

1. 导入所需的库:

cv2用于视频捕获和图像处理,tkinter用于创建GUI,filedialog用于打开文件对话框,Image和ImageTk用于处理图像,threading用于创建新线程以更新视频帧,subprocess用于启动其他Python脚本。

python 复制代码
import cv2
import tkinter as tk
from tkinter import filedialog
from PIL import Image, ImageTk
import threading
import subprocess

2. 创建Tkinter主窗口并设置标题:

python 复制代码
# 初始化窗口
root = tk.Tk()
root.title("视频识别猫狗")

3. 设置窗口的宽度和高度:

python 复制代码
# 设置窗口大小
window_width = 800
window_height = 600
root.geometry(f"{window_width}x{window_height}")

4. 创建一个Canvas,它将用于显示视频帧:

python 复制代码
# 创建一个Canvas用于显示视频
canvas = tk.Canvas(root, width=window_width, height=window_height, bg="white")
canvas.pack()

5. 初始化一个视频流变量cap,用于存储OpenCV的视频捕获对象:

python 复制代码
# 初始化视频流
cap = None

6. 定义一个函数update_frame,用于更新Canvas上的视频帧。函数实现将在后面解释:

python 复制代码
# 更新视频帧的函数
def update_frame():
    global cap
    while cap is not None and cap.isOpened():
        ret, frame = cap.read()
        if ret:
            # 转换为灰度图像
            gray = cv2.cvtColor(frame, cv2.COLOR_BGR2GRAY)

            # 加载Haar cascade文件
            cat_cascade = cv2.CascadeClassifier('haarcascade_frontalcatface.xml')
            dog_cascade = cv2.CascadeClassifier('haarcascade_frontalface_alt.xml')

            # 检测猫和狗
            cats = cat_cascade.detectMultiScale(gray, scaleFactor=1.1, minNeighbors=5, minSize=(30, 30))
            dogs = dog_cascade.detectMultiScale(gray, scaleFactor=1.1, minNeighbors=5, minSize=(30, 30))

            # 在检测到的猫和狗周围画矩形框
            for (x, y, w, h) in cats:
                cv2.rectangle(frame, (x, y), (x+w, y+h), (0, 255, 0), 2)
            for (x, y, w, h) in dogs:
                cv2.rectangle(frame, (x, y), (x+w, y+h), (0, 255, 0), 2)

            # 转换为Tkinter兼容的格式并显示
            frame = cv2.cvtColor(frame, cv2.COLOR_BGR2RGB)
            image = Image.fromarray(frame)
            image = ImageTk.PhotoImage(image)

            # 自动调整Canvas大小以适应视频帧
            canvas.config(width=image.width(), height=image.height())
            canvas.create_image(0, 0, anchor=tk.NW, image=image)
            root.update_idletasks()
            root.after(10, update_frame)  # 每10毫秒更新一次帧
        else:
            cap.release()
            break

7. 定义一个函数update_frame,用于更新Canvas上的视频帧。函数实现将在后面解释:

python 复制代码
# 选择视频的函数
def select_video():
    global cap
    file_path = filedialog.askopenfilename(initialdir="data/视频识别数据")
    if file_path:
        cap = cv2.VideoCapture(file_path)
        threading.Thread(target=update_frame).start()

8. 定义一个函数close,用于退出程序并关闭视频流。函数实现将在后面解释:

python 复制代码
# 退出程序的函数
def close():
    # 停止视频流
    subprocess.Popen(["python", "主页面.py"])
    if cap is not None and cap.isOpened():
        cap.release()
    # 销毁窗口
    root.destroy()
    # 启动主页面程序

9. 创建两个按钮,一个用于选择视频文件,另一个用于退出程序。按钮的图片和位置在这里设置:

python 复制代码
# 创建按钮
image = Image.open("选择视频.gif")  # 加载一张图片
photo2 = ImageTk.PhotoImage(image)
bt1 = tk.Button(root, image=photo2, width=162, height=100, command=select_video)
bt1.place(x=150, y=470)

image = Image.open("退出.gif")  # 加载一张图片
photo3 = ImageTk.PhotoImage(image)
bt1 = tk.Button(root, image=photo3, width=162, height=100, command=close)
bt1.place(x=500, y=470)

10. 启动Tkinter的事件循环,这将显示窗口并开始处理用户事件:

python 复制代码
root.mainloop()

11. 完整代码+运行结果:

完整代码:

python 复制代码
import cv2
import tkinter as tk
from tkinter import filedialog
from PIL import Image, ImageTk
import threading
import subprocess

# 初始化窗口
root = tk.Tk()
root.title("视频识别猫狗")

# 设置窗口大小
window_width = 800
window_height = 600
root.geometry(f"{window_width}x{window_height}")

# 创建一个Canvas用于显示视频
canvas = tk.Canvas(root, width=window_width, height=window_height, bg="white")
canvas.pack()

# 初始化视频流
cap = None

# 更新视频帧的函数
def update_frame():
    global cap
    while cap is not None and cap.isOpened():
        ret, frame = cap.read()
        if ret:
            # 转换为灰度图像
            gray = cv2.cvtColor(frame, cv2.COLOR_BGR2GRAY)

            # 加载Haar cascade文件
            cat_cascade = cv2.CascadeClassifier('haarcascade_frontalcatface.xml')
            dog_cascade = cv2.CascadeClassifier('haarcascade_frontalface_alt.xml')

            # 检测猫和狗
            cats = cat_cascade.detectMultiScale(gray, scaleFactor=1.1, minNeighbors=5, minSize=(30, 30))
            dogs = dog_cascade.detectMultiScale(gray, scaleFactor=1.1, minNeighbors=5, minSize=(30, 30))

            # 在检测到的猫和狗周围画矩形框
            for (x, y, w, h) in cats:
                cv2.rectangle(frame, (x, y), (x+w, y+h), (0, 255, 0), 2)
            for (x, y, w, h) in dogs:
                cv2.rectangle(frame, (x, y), (x+w, y+h), (0, 255, 0), 2)

            # 转换为Tkinter兼容的格式并显示
            frame = cv2.cvtColor(frame, cv2.COLOR_BGR2RGB)
            image = Image.fromarray(frame)
            image = ImageTk.PhotoImage(image)

            # 自动调整Canvas大小以适应视频帧
            canvas.config(width=image.width(), height=image.height())
            canvas.create_image(0, 0, anchor=tk.NW, image=image)
            root.update_idletasks()
            root.after(10, update_frame)  # 每10毫秒更新一次帧
        else:
            cap.release()
            break

# 选择视频的函数
def select_video():
    global cap
    file_path = filedialog.askopenfilename(initialdir="data/视频识别数据")
    if file_path:
        cap = cv2.VideoCapture(file_path)
        threading.Thread(target=update_frame).start()

# 退出程序的函数
def close():
    # 停止视频流
    subprocess.Popen(["python", "主页面.py"])
    if cap is not None and cap.isOpened():
        cap.release()
    # 销毁窗口
    root.destroy()
    # 启动主页面程序

# 创建按钮
image = Image.open("选择视频.gif")  # 加载一张图片
photo2 = ImageTk.PhotoImage(image)
bt1 = tk.Button(root, image=photo2, width=162, height=100, command=select_video)
bt1.place(x=150, y=470)

image = Image.open("退出.gif")  # 加载一张图片
photo3 = ImageTk.PhotoImage(image)
bt1 = tk.Button(root, image=photo3, width=162, height=100, command=close)
bt1.place(x=500, y=470)

root.mainloop()

运行结果:

相关推荐
张槊哲8 分钟前
函数的定义与使用(python)
开发语言·python
船长@Quant13 分钟前
文档构建:Sphinx全面使用指南 — 实战篇
python·markdown·sphinx·文档构建
青松@FasterAI31 分钟前
【程序员 NLP 入门】词嵌入 - 上下文中的窗口大小是什么意思? (★小白必会版★)
人工智能·自然语言处理
AIGC大时代1 小时前
高效使用DeepSeek对“情境+ 对象 +问题“型课题进行开题!
数据库·人工智能·算法·aigc·智能写作·deepseek
硅谷秋水1 小时前
GAIA-2:用于自动驾驶的可控多视图生成世界模型
人工智能·机器学习·自动驾驶
偶尔微微一笑1 小时前
AI网络渗透kali应用(gptshell)
linux·人工智能·python·自然语言处理·编辑器
深度之眼1 小时前
2025时间序列都有哪些创新点可做——总结篇
人工智能·深度学习·机器学习·时间序列
沅_Yuan1 小时前
基于贝叶斯优化的Transformer多输入单输出回归预测模型Bayes-Transformer【MATLAB】
神经网络·matlab·回归·贝叶斯·transformer·回归预测
晓数2 小时前
【硬核干货】JetBrains AI Assistant 干货笔记
人工智能·笔记·jetbrains·ai assistant
jndingxin2 小时前
OpenCV 图形API(60)颜色空间转换-----将图像从 YUV 色彩空间转换为 RGB 色彩空间函数YUV2RGB()
人工智能·opencv·计算机视觉