使用 Python 和 OpenCV 实现摄像头人脸检测并截图

概述

在现代应用中,人脸检测是一项非常重要的技术,广泛应用于安全监控、身份验证等领域。本文将详细介绍如何使用 Python 和 OpenCV 库实现摄像头人脸检测并截图,并通过具体的代码示例来展示整个过程。

环境准备

在开始编写代码之前,确保已经安装了 OpenCV 库。可以使用以下命令安装:

sh 复制代码
pip install opencv-python
代码详解
python 复制代码
# -*- coding: utf-8 -*-
# import 进openCV的库
import cv2
import os
import time

# 调用摄像头检测人脸并截图
def camera(window_name, path_name):

    # Linux 不显示图形界面
    cv2.namedWindow(window_name)

    # 视频来源,来自USB摄像头
    cap = cv2.VideoCapture(0)

    # 告诉OpenCV使用人脸识别分类器
    classfier = cv2.CascadeClassifier(os.getcwd()+"/haarcascade_frontalface_alt.xml")

    # 识别出人脸后要画的边框的颜色,RGB格式, color是一个不可增删的数组
    color = (0, 255, 0)

    num = 0
    while cap.isOpened():
        ok, frame = cap.read()  # 读取一帧数据
        if not ok:
            break

        # 将当前桢图像转换成灰度图像
        grey = cv2.cvtColor(frame, cv2.COLOR_BGR2GRAY)
        # 人脸检测,1.2和2分别为图片缩放比例和需要检测的有效点数
        faceRects = classfier.detectMultiScale(grey, scaleFactor=1.2, minNeighbors=3, minSize=(32, 32))
        if len(faceRects) > 0:  # 大于0则检测到人脸
            for faceRect in faceRects:  # 单独框出每一张人脸
                x, y, w, h = faceRect
                num = num + 1
                # 将当前帧保存为图片
                img_name = "%s/%d.jpg" % (path_name, num)
                image = frame[y - 10: y + h + 10, x - 10: x + w + 10]
                cv2.imwrite(img_name, image, [int(cv2.IMWRITE_PNG_COMPRESSION), 9])

                # 延迟 60s,不要太频繁的发送,知道来了就可以了
                # time.sleep(60)
                # 画出矩形框
                cv2.rectangle(frame, (x - 10, y - 10), (x + w + 10, y + h + 10), color, 2)
                # 显示当前捕捉到了多少人脸图片了
                font = cv2.FONT_HERSHEY_SIMPLEX
                cv2.putText(frame, 'num:%d/1000' % (num), (x + 30, y + 30), font, 1, (255, 0, 255), 4)

        # 显示图像 Linux 下注释掉即可
        cv2.imshow(window_name, frame)
        c = cv2.waitKey(10)
        if c & 0xFF == ord('q'):
            break
    # 释放摄像头并销毁所有窗口
    cap.release()
    cv2.destroyAllWindows()

if __name__ == '__main__':
    camera("watchdog", os.getcwd()+"/face")
代码解析
1. 导入必要的模块
python 复制代码
# -*- coding: utf-8 -*-
# import 进openCV的库
import cv2
import os
import time
  • # -*- coding: utf-8 -*-:指定文件编码为 UTF-8。
  • import cv2:导入 OpenCV 库,用于图像处理和人脸检测。
  • import os:导入 os 模块,用于文件路径操作。
  • import time:导入 time 模块,用于延迟操作。
2. 定义 camera 函数
python 复制代码
def camera(window_name, path_name):
  • def camera(window_name, path_name)::定义一个名为 camera 的函数,参数 window_name 是窗口名称,path_name 是保存截图的路径。
3. 创建窗口
python 复制代码
    # Linux 不显示图形界面
    cv2.namedWindow(window_name)
  • cv2.namedWindow(window_name):创建一个窗口,用于显示视频流。在 Linux 下可以注释掉这行代码以不显示图形界面。
4. 打开摄像头
python 复制代码
    # 视频来源,来自USB摄像头
    cap = cv2.VideoCapture(0)
  • cv2.VideoCapture(0):打开默认摄像头。参数 0 表示默认摄像头。
5. 加载人脸识别分类器
python 复制代码
    # 告诉OpenCV使用人脸识别分类器
    classfier = cv2.CascadeClassifier(os.getcwd()+"/haarcascade_frontalface_alt.xml")
  • cv2.CascadeClassifier(...):加载预训练的 Haar 级联分类器,用于检测人脸。
  • os.getcwd()+"/haarcascade_frontalface_alt.xml":指定分类器文件的路径。
6. 设置边框颜色
python 复制代码
    # 识别出人脸后要画的边框的颜色,RGB格式, color是一个不可增删的数组
    color = (0, 255, 0)
  • color = (0, 255, 0):定义边框颜色为绿色。
7. 主循环
python 复制代码
    num = 0
    while cap.isOpened():
        ok, frame = cap.read()  # 读取一帧数据
        if not ok:
            break

        # 将当前桢图像转换成灰度图像
        grey = cv2.cvtColor(frame, cv2.COLOR_BGR2GRAY)
        # 人脸检测,1.2和2分别为图片缩放比例和需要检测的有效点数
        faceRects = classfier.detectMultiScale(grey, scaleFactor=1.2, minNeighbors=3, minSize=(32, 32))
        if len(faceRects) > 0:  # 大于0则检测到人脸
            for faceRect in faceRects:  # 单独框出每一张人脸
                x, y, w, h = faceRect
                num = num + 1
                # 将当前帧保存为图片
                img_name = "%s/%d.jpg" % (path_name, num)
                image = frame[y - 10: y + h + 10, x - 10: x + w + 10]
                cv2.imwrite(img_name, image, [int(cv2.IMWRITE_PNG_COMPRESSION), 9])

                # 延迟 60s,不要太频繁的发送,知道来了就可以了
                # time.sleep(60)
                # 画出矩形框
                cv2.rectangle(frame, (x - 10, y - 10), (x + w + 10, y + h + 10), color, 2)
                # 显示当前捕捉到了多少人脸图片了
                font = cv2.FONT_HERSHEY_SIMPLEX
                cv2.putText(frame, 'num:%d/1000' % (num), (x + 30, y + 30), font, 1, (255, 0, 255), 4)

        # 显示图像 Linux 下注释掉即可
        cv2.imshow(window_name, frame)
        c = cv2.waitKey(10)
        if c & 0xFF == ord('q'):
            break
  • num = 0:初始化计数器。
  • while cap.isOpened()::进入无限循环,实时读取摄像头图像。
  • ok, frame = cap.read():从摄像头读取一帧图像。
  • if not ok::检查读取是否成功,如果失败则退出循环。
  • grey = cv2.cvtColor(frame, cv2.COLOR_BGR2GRAY):将图像转换为灰度图像。
  • faceRects = classfier.detectMultiScale(grey, scaleFactor=1.2, minNeighbors=3, minSize=(32, 32)):检测图像中的人脸。
  • if len(faceRects) > 0::检查是否检测到人脸。
  • for faceRect in faceRects::遍历检测到的每个人脸。
  • x, y, w, h = faceRect:获取人脸的位置和大小。
  • num = num + 1:增加计数器。
  • img_name = "%s/%d.jpg" % (path_name, num):生成保存图像的文件名。
  • image = frame[y - 10: y + h + 10, x - 10: x + w + 10]:裁剪人脸区域并扩大边界。
  • cv2.imwrite(img_name, image, [int(cv2.IMWRITE_PNG_COMPRESSION), 9]):保存图像。
  • cv2.rectangle(frame, (x - 10, y - 10), (x + w + 10, y + h + 10), color, 2):在图像上绘制矩形框。
  • font = cv2.FONT_HERSHEY_SIMPLEX:设置字体样式。
  • cv2.putText(frame, 'num:%d/1000' % (num), (x + 30, y + 30), font, 1, (255, 0, 255), 4):在图像上显示当前捕捉到的人脸数量。
  • cv2.imshow(window_name, frame):显示带有矩形标记的图像。
  • c = cv2.waitKey(10):等待 10 毫秒,等待用户按键。
  • if c & 0xFF == ord('q')::按 'q' 键退出循环。
8. 释放资源
python 复制代码
    # 释放摄像头并销毁所有窗口
    cap.release()
    cv2.destroyAllWindows()
  • cap.release():释放摄像头资源。
  • cv2.destroyAllWindows():关闭所有 OpenCV 窗口。
9. 主程序入口
python 复制代码
if __name__ == '__main__':
    camera("watchdog", os.getcwd()+"/face")
  • if __name__ == '__main__'::检查是否直接运行此脚本。
  • camera("watchdog", os.getcwd()+"/face"):调用 camera 函数,传入窗口名称和保存截图的路径。
完整代码
python 复制代码
# -*- coding: utf-8 -*-
# import 进openCV的库
import cv2
import os
import time
# 调用摄像头检测人脸并截图
def camera(window_name, path_name):

    # Linux 不显示图形界面
    cv2.namedWindow(window_name)

    # 视频来源,来自USB摄像头
    cap = cv2.VideoCapture(0)

    # 告诉OpenCV使用人脸识别分类器
    classfier = cv2.CascadeClassifier(os.getcwd()+"/haarcascade_frontalface_alt.xml")

    # 识别出人脸后要画的边框的颜色,RGB格式, color是一个不可增删的数组
    color = (0, 255, 0)

    num = 0
    while cap.isOpened():
        ok, frame = cap.read()  # 读取一帧数据
        if not ok:
            break

        # 将当前桢图像转换成灰度图像
        grey = cv2.cvtColor(frame, cv2.COLOR_BGR2GRAY)
        # 人脸检测,1.2和2分别为图片缩放比例和需要检测的有效点数
        faceRects = classfier.detectMultiScale(grey, scaleFactor=1.2, minNeighbors=3, minSize=(32, 32))
        if len(faceRects) > 0:  # 大于0则检测到人脸
            for faceRect in faceRects:  # 单独框出每一张人脸
                x, y, w, h = faceRect
                num = num+1
                # 将当前帧保存为图片
                img_name = "%s/%d.jpg" % (path_name, num)
                image = frame[y - 10: y + h + 10, x - 10: x + w + 10]
                cv2.imwrite(img_name, image, [int(cv2.IMWRITE_PNG_COMPRESSION), 9])

                # 延迟 60s,不要太频繁的发送,知道来了就可以了
                # time.sleep(60)
                # 画出矩形框
                cv2.rectangle(frame, (x - 10, y - 10), (x + w + 10, y + h + 10), color, 2)
                # 显示当前捕捉到了多少人脸图片了
                font = cv2.FONT_HERSHEY_SIMPLEX
                cv2.putText(frame, 'num:%d/1000' % (num), (x + 30, y + 30), font, 1, (255, 0, 255), 4)

        # 显示图像 Linux 下注释掉即可
        cv2.imshow(window_name, frame)
        c = cv2.waitKey(10)
        if c & 0xFF == ord('q'):
            break
    # 释放摄像头并销毁所有窗口
    cap.release()
    cv2.destroyAllWindows()




if __name__ == '__main__':
    camera("watchdog", os.getcwd()+"/face")
测试
  1. 确保你的摄像头正常工作。

  2. 运行脚本:

    sh 复制代码
    python3 face_detection.py
  3. 打开摄像头后,你会看到一个窗口显示实时视频流,并且在检测到的人脸周围绘制绿色矩形。

  4. 按 'q' 键退出程序。

总结

本文详细介绍了如何使用 Python 和 OpenCV 库实现摄像头人脸检测并截图,并通过具体的代码示例展示了整个过程。通过使用 cv2.VideoCapture 打开摄像头,cv2.CascadeClassifier 加载预训练的 Haar 级联分类器,cv2.cvtColor 转换图像颜色空间,cv2.rectangle 绘制矩形,cv2.imwrite 保存图像,最终实现了在实时视频流中检测并保存人脸图像的功能。


相关推荐
数据小爬虫@几秒前
利用Python爬虫快速获取商品历史价格信息
开发语言·爬虫·python
bastgia16 分钟前
Tokenformer: 下一代Transformer架构
人工智能·机器学习·llm
是Dream呀19 分钟前
Python从0到100(七十八):神经网络--从0开始搭建全连接网络和CNN网络
网络·python·神经网络
菜狗woc25 分钟前
opencv-python的简单练习
人工智能·python·opencv
15年网络推广青哥29 分钟前
国际抖音TikTok矩阵运营的关键要素有哪些?
大数据·人工智能·矩阵
最爱番茄味37 分钟前
Python实例之函数基础打卡篇
开发语言·python
weixin_387545641 小时前
探索 AnythingLLM:借助开源 AI 打造私有化智能知识库
人工智能
程序猿000001号1 小时前
探索Python的pytest库:简化单元测试的艺术
python·单元测试·pytest
engchina1 小时前
如何在 Python 中忽略烦人的警告?
开发语言·人工智能·python
paixiaoxin2 小时前
CV-OCR经典论文解读|An Empirical Study of Scaling Law for OCR/OCR 缩放定律的实证研究
人工智能·深度学习·机器学习·生成对抗网络·计算机视觉·ocr·.net