使用 Python 和 OpenCV 实现摄像头人脸检测并截图

概述

在现代应用中,人脸检测是一项非常重要的技术,广泛应用于安全监控、身份验证等领域。本文将详细介绍如何使用 Python 和 OpenCV 库实现摄像头人脸检测并截图,并通过具体的代码示例来展示整个过程。

环境准备

在开始编写代码之前,确保已经安装了 OpenCV 库。可以使用以下命令安装:

sh 复制代码
pip install opencv-python
代码详解
python 复制代码
# -*- coding: utf-8 -*-
# import 进openCV的库
import cv2
import os
import time

# 调用摄像头检测人脸并截图
def camera(window_name, path_name):

    # Linux 不显示图形界面
    cv2.namedWindow(window_name)

    # 视频来源,来自USB摄像头
    cap = cv2.VideoCapture(0)

    # 告诉OpenCV使用人脸识别分类器
    classfier = cv2.CascadeClassifier(os.getcwd()+"/haarcascade_frontalface_alt.xml")

    # 识别出人脸后要画的边框的颜色,RGB格式, color是一个不可增删的数组
    color = (0, 255, 0)

    num = 0
    while cap.isOpened():
        ok, frame = cap.read()  # 读取一帧数据
        if not ok:
            break

        # 将当前桢图像转换成灰度图像
        grey = cv2.cvtColor(frame, cv2.COLOR_BGR2GRAY)
        # 人脸检测,1.2和2分别为图片缩放比例和需要检测的有效点数
        faceRects = classfier.detectMultiScale(grey, scaleFactor=1.2, minNeighbors=3, minSize=(32, 32))
        if len(faceRects) > 0:  # 大于0则检测到人脸
            for faceRect in faceRects:  # 单独框出每一张人脸
                x, y, w, h = faceRect
                num = num + 1
                # 将当前帧保存为图片
                img_name = "%s/%d.jpg" % (path_name, num)
                image = frame[y - 10: y + h + 10, x - 10: x + w + 10]
                cv2.imwrite(img_name, image, [int(cv2.IMWRITE_PNG_COMPRESSION), 9])

                # 延迟 60s,不要太频繁的发送,知道来了就可以了
                # time.sleep(60)
                # 画出矩形框
                cv2.rectangle(frame, (x - 10, y - 10), (x + w + 10, y + h + 10), color, 2)
                # 显示当前捕捉到了多少人脸图片了
                font = cv2.FONT_HERSHEY_SIMPLEX
                cv2.putText(frame, 'num:%d/1000' % (num), (x + 30, y + 30), font, 1, (255, 0, 255), 4)

        # 显示图像 Linux 下注释掉即可
        cv2.imshow(window_name, frame)
        c = cv2.waitKey(10)
        if c & 0xFF == ord('q'):
            break
    # 释放摄像头并销毁所有窗口
    cap.release()
    cv2.destroyAllWindows()

if __name__ == '__main__':
    camera("watchdog", os.getcwd()+"/face")
代码解析
1. 导入必要的模块
python 复制代码
# -*- coding: utf-8 -*-
# import 进openCV的库
import cv2
import os
import time
  • # -*- coding: utf-8 -*-:指定文件编码为 UTF-8。
  • import cv2:导入 OpenCV 库,用于图像处理和人脸检测。
  • import os:导入 os 模块,用于文件路径操作。
  • import time:导入 time 模块,用于延迟操作。
2. 定义 camera 函数
python 复制代码
def camera(window_name, path_name):
  • def camera(window_name, path_name)::定义一个名为 camera 的函数,参数 window_name 是窗口名称,path_name 是保存截图的路径。
3. 创建窗口
python 复制代码
    # Linux 不显示图形界面
    cv2.namedWindow(window_name)
  • cv2.namedWindow(window_name):创建一个窗口,用于显示视频流。在 Linux 下可以注释掉这行代码以不显示图形界面。
4. 打开摄像头
python 复制代码
    # 视频来源,来自USB摄像头
    cap = cv2.VideoCapture(0)
  • cv2.VideoCapture(0):打开默认摄像头。参数 0 表示默认摄像头。
5. 加载人脸识别分类器
python 复制代码
    # 告诉OpenCV使用人脸识别分类器
    classfier = cv2.CascadeClassifier(os.getcwd()+"/haarcascade_frontalface_alt.xml")
  • cv2.CascadeClassifier(...):加载预训练的 Haar 级联分类器,用于检测人脸。
  • os.getcwd()+"/haarcascade_frontalface_alt.xml":指定分类器文件的路径。
6. 设置边框颜色
python 复制代码
    # 识别出人脸后要画的边框的颜色,RGB格式, color是一个不可增删的数组
    color = (0, 255, 0)
  • color = (0, 255, 0):定义边框颜色为绿色。
7. 主循环
python 复制代码
    num = 0
    while cap.isOpened():
        ok, frame = cap.read()  # 读取一帧数据
        if not ok:
            break

        # 将当前桢图像转换成灰度图像
        grey = cv2.cvtColor(frame, cv2.COLOR_BGR2GRAY)
        # 人脸检测,1.2和2分别为图片缩放比例和需要检测的有效点数
        faceRects = classfier.detectMultiScale(grey, scaleFactor=1.2, minNeighbors=3, minSize=(32, 32))
        if len(faceRects) > 0:  # 大于0则检测到人脸
            for faceRect in faceRects:  # 单独框出每一张人脸
                x, y, w, h = faceRect
                num = num + 1
                # 将当前帧保存为图片
                img_name = "%s/%d.jpg" % (path_name, num)
                image = frame[y - 10: y + h + 10, x - 10: x + w + 10]
                cv2.imwrite(img_name, image, [int(cv2.IMWRITE_PNG_COMPRESSION), 9])

                # 延迟 60s,不要太频繁的发送,知道来了就可以了
                # time.sleep(60)
                # 画出矩形框
                cv2.rectangle(frame, (x - 10, y - 10), (x + w + 10, y + h + 10), color, 2)
                # 显示当前捕捉到了多少人脸图片了
                font = cv2.FONT_HERSHEY_SIMPLEX
                cv2.putText(frame, 'num:%d/1000' % (num), (x + 30, y + 30), font, 1, (255, 0, 255), 4)

        # 显示图像 Linux 下注释掉即可
        cv2.imshow(window_name, frame)
        c = cv2.waitKey(10)
        if c & 0xFF == ord('q'):
            break
  • num = 0:初始化计数器。
  • while cap.isOpened()::进入无限循环,实时读取摄像头图像。
  • ok, frame = cap.read():从摄像头读取一帧图像。
  • if not ok::检查读取是否成功,如果失败则退出循环。
  • grey = cv2.cvtColor(frame, cv2.COLOR_BGR2GRAY):将图像转换为灰度图像。
  • faceRects = classfier.detectMultiScale(grey, scaleFactor=1.2, minNeighbors=3, minSize=(32, 32)):检测图像中的人脸。
  • if len(faceRects) > 0::检查是否检测到人脸。
  • for faceRect in faceRects::遍历检测到的每个人脸。
  • x, y, w, h = faceRect:获取人脸的位置和大小。
  • num = num + 1:增加计数器。
  • img_name = "%s/%d.jpg" % (path_name, num):生成保存图像的文件名。
  • image = frame[y - 10: y + h + 10, x - 10: x + w + 10]:裁剪人脸区域并扩大边界。
  • cv2.imwrite(img_name, image, [int(cv2.IMWRITE_PNG_COMPRESSION), 9]):保存图像。
  • cv2.rectangle(frame, (x - 10, y - 10), (x + w + 10, y + h + 10), color, 2):在图像上绘制矩形框。
  • font = cv2.FONT_HERSHEY_SIMPLEX:设置字体样式。
  • cv2.putText(frame, 'num:%d/1000' % (num), (x + 30, y + 30), font, 1, (255, 0, 255), 4):在图像上显示当前捕捉到的人脸数量。
  • cv2.imshow(window_name, frame):显示带有矩形标记的图像。
  • c = cv2.waitKey(10):等待 10 毫秒,等待用户按键。
  • if c & 0xFF == ord('q')::按 'q' 键退出循环。
8. 释放资源
python 复制代码
    # 释放摄像头并销毁所有窗口
    cap.release()
    cv2.destroyAllWindows()
  • cap.release():释放摄像头资源。
  • cv2.destroyAllWindows():关闭所有 OpenCV 窗口。
9. 主程序入口
python 复制代码
if __name__ == '__main__':
    camera("watchdog", os.getcwd()+"/face")
  • if __name__ == '__main__'::检查是否直接运行此脚本。
  • camera("watchdog", os.getcwd()+"/face"):调用 camera 函数,传入窗口名称和保存截图的路径。
完整代码
python 复制代码
# -*- coding: utf-8 -*-
# import 进openCV的库
import cv2
import os
import time
# 调用摄像头检测人脸并截图
def camera(window_name, path_name):

    # Linux 不显示图形界面
    cv2.namedWindow(window_name)

    # 视频来源,来自USB摄像头
    cap = cv2.VideoCapture(0)

    # 告诉OpenCV使用人脸识别分类器
    classfier = cv2.CascadeClassifier(os.getcwd()+"/haarcascade_frontalface_alt.xml")

    # 识别出人脸后要画的边框的颜色,RGB格式, color是一个不可增删的数组
    color = (0, 255, 0)

    num = 0
    while cap.isOpened():
        ok, frame = cap.read()  # 读取一帧数据
        if not ok:
            break

        # 将当前桢图像转换成灰度图像
        grey = cv2.cvtColor(frame, cv2.COLOR_BGR2GRAY)
        # 人脸检测,1.2和2分别为图片缩放比例和需要检测的有效点数
        faceRects = classfier.detectMultiScale(grey, scaleFactor=1.2, minNeighbors=3, minSize=(32, 32))
        if len(faceRects) > 0:  # 大于0则检测到人脸
            for faceRect in faceRects:  # 单独框出每一张人脸
                x, y, w, h = faceRect
                num = num+1
                # 将当前帧保存为图片
                img_name = "%s/%d.jpg" % (path_name, num)
                image = frame[y - 10: y + h + 10, x - 10: x + w + 10]
                cv2.imwrite(img_name, image, [int(cv2.IMWRITE_PNG_COMPRESSION), 9])

                # 延迟 60s,不要太频繁的发送,知道来了就可以了
                # time.sleep(60)
                # 画出矩形框
                cv2.rectangle(frame, (x - 10, y - 10), (x + w + 10, y + h + 10), color, 2)
                # 显示当前捕捉到了多少人脸图片了
                font = cv2.FONT_HERSHEY_SIMPLEX
                cv2.putText(frame, 'num:%d/1000' % (num), (x + 30, y + 30), font, 1, (255, 0, 255), 4)

        # 显示图像 Linux 下注释掉即可
        cv2.imshow(window_name, frame)
        c = cv2.waitKey(10)
        if c & 0xFF == ord('q'):
            break
    # 释放摄像头并销毁所有窗口
    cap.release()
    cv2.destroyAllWindows()




if __name__ == '__main__':
    camera("watchdog", os.getcwd()+"/face")
测试
  1. 确保你的摄像头正常工作。

  2. 运行脚本:

    sh 复制代码
    python3 face_detection.py
  3. 打开摄像头后,你会看到一个窗口显示实时视频流,并且在检测到的人脸周围绘制绿色矩形。

  4. 按 'q' 键退出程序。

总结

本文详细介绍了如何使用 Python 和 OpenCV 库实现摄像头人脸检测并截图,并通过具体的代码示例展示了整个过程。通过使用 cv2.VideoCapture 打开摄像头,cv2.CascadeClassifier 加载预训练的 Haar 级联分类器,cv2.cvtColor 转换图像颜色空间,cv2.rectangle 绘制矩形,cv2.imwrite 保存图像,最终实现了在实时视频流中检测并保存人脸图像的功能。


相关推荐
小白学大数据32 分钟前
Python爬虫开发中的分析与方案制定
开发语言·c++·爬虫·python
扫地的小何尚1 小时前
NVIDIA RTX 系统上使用 llama.cpp 加速 LLM
人工智能·aigc·llama·gpu·nvidia·cuda·英伟达
Shy9604181 小时前
Doc2Vec句子向量
python·语言模型
埃菲尔铁塔_CV算法4 小时前
深度学习神经网络创新点方向
人工智能·深度学习·神经网络
艾思科蓝-何老师【H8053】4 小时前
【ACM出版】第四届信号处理与通信技术国际学术会议(SPCT 2024)
人工智能·信号处理·论文发表·香港中文大学
秀儿还能再秀4 小时前
机器学习——简单线性回归、逻辑回归
笔记·python·学习·机器学习
weixin_452600694 小时前
《青牛科技 GC6125:驱动芯片中的璀璨之星,点亮 IPcamera 和云台控制(替代 BU24025/ROHM)》
人工智能·科技·单片机·嵌入式硬件·新能源充电桩·智能充电枪
学术搬运工4 小时前
【珠海科技学院主办,暨南大学协办 | IEEE出版 | EI检索稳定 】2024年健康大数据与智能医疗国际会议(ICHIH 2024)
大数据·图像处理·人工智能·科技·机器学习·自然语言处理
右恩5 小时前
AI大模型重塑软件开发:流程革新与未来展望
人工智能
图片转成excel表格5 小时前
WPS Office Excel 转 PDF 后图片丢失的解决方法
人工智能·科技·深度学习