OpenCv高阶(十八)——dlib人脸检测与识别

文章目录


一、dlib库是什么?

dlib是一个适用于C++和Python的第三方库。包含机器学习、计算机视觉和图像处理的工具包,被广泛的应用于机器人、嵌入式设备、移动电话和大型高性能计算环境。是开源许可用户免费使用。

二、opencv库与dlib库的优缺点对比

1、opencv优缺点

优点

1)可以在CPU上实时工作;

2)简单的架构;

3)可以检测不同比例的人脸。

缺点

1)会出现大量的把非人脸预测为人脸的情况;

2)不适用于非正面人脸图像;

3)不抗遮挡。

2、dlib库优缺点

优点

1)适用于正面和略微非正面的人脸;

2)语法极简单

3)再小的遮挡下仍可工作。

缺点

1)不能检测小脸,因为它训练数据的最小人脸尺寸为80×80,较小尺寸的人脸数据需自己训练检测器;

2)边界框通常排除前额的一部分甚至下巴的一部分;

3)不适用于侧面和极端非正面,如俯视或仰视。

三、dlib库的安装

1、在线安装

python 复制代码
pip install dlib --i 镜像地址

dlib官网:https://dlib.net/compile.html

2、本地安装

找到dlib库的whl文件进行安装,将whl文件下载到本地安装。

dlib资源: https://github.com/z-mahmud22/Dlib_Windows_Python3.x

四、dlib库的人脸检测器

dlib 提供 两种主流人脸检测器,适用于不同场景:

1. 基于 HOG 的检测器

python 复制代码
detector = dlib.get_frontal_face_detector()  # 默认使用此方法

算法原理:

使用 方向梯度直方图 (HOG) 特征描述图像局部区域的梯度方向分布

结合 线性分类器 (SVM) 进行人脸判别

通过 图像金字塔 和 滑动窗口 实现多尺度检测

特点:

✅ 速度快:适合实时检测(CPU 上可达 30+ FPS)

✅ 轻量级:模型文件小(约 2MB)

⚠️ 局限性:对侧脸、遮挡人脸检测效果较差

2. 基于 CNN 的检测器

python 复制代码
cnn_detector = dlib.cnn_face_detection_model_v1("mmod_human_face_detector.dat")

算法原理:

使用 卷积神经网络 (CNN) 进行端到端的人脸检测

需要预训练权重文件(需单独下载)

特点:

✅ 高精度:对侧脸、部分遮挡、复杂背景鲁棒性强

⚠️ 资源消耗大:需要 GPU 加速(CPU 上较慢)

⚠️ 模型文件较大(约 200MB)

五、dlib人脸检测的简单使用

1、导入必要库

python 复制代码
import cv2       # OpenCV库,用于图像处理和显示
import dlib      # 机器学习库,用于人脸特征检测

2、初始化人脸检测器

python 复制代码
# 使用dlib内置的基于HOG特征的方向梯度直方图人脸检测器
# 该检测器对正脸检测效果较好,返回人脸矩形坐标
detector = dlib.get_frontal_face_detector()

3、读取图像文件

python 复制代码
# 从指定路径加载图像文件,OpenCV默认读取为BGR格式
img = cv2.imread("../data/pd.png")  

4、执行人脸检测

python 复制代码
# 参数说明:
# 1. 输入图像(img)
# 2. 图像放大系数(4):通过上采样图像4次来检测更小的人脸
# 返回值:dlib.rectangle对象组成的可迭代对象,包含人脸区域坐标
faces = detector(img, 4)  

5、 遍历检测结果并标注

python 复制代码
for face in faces:
    # 解析人脸矩形坐标:
    x1 = face.left()   # 人脸框左侧x坐标
    y1 = face.top()    # 人脸框顶部y坐标
    x2 = face.right()  # 人脸框右侧x坐标
    y2 = face.bottom() # 人脸框底部y坐标
    
    # 在图像上绘制绿色矩形框标注人脸
    # 参数说明:
    # 1. 目标图像
    # 2. 左上角坐标 (x1, y1)
    # 3. 右下角坐标 (x2, y2)
    # 4. 颜色 (BGR格式,此处为绿色)
    # 5. 线宽(2像素)
    cv2.rectangle(img, (x1, y1), (x2, y2), (0, 255, 0), 2)

6、显示检测结果

python 复制代码
cv2.imshow('Face Detection Result', img)  # 创建显示窗口
cv2.waitKey(0)            # 等待任意按键(0表示无限等待)
cv2.destroyAllWindows()   # 关闭所有OpenCV窗口

总结

Dlib的人脸检测技术通过提供双引擎解决方案,在计算机视觉领域展现了独特的平衡艺术:其HOG检测器以轻量高效的特性(2MB模型、30+ FPS实时性)成为移动端和实时视频的首选,而CNN检测器凭借深度学习带来的高精度(支持多角度、复杂光照),在静态图像分析中树立了行业标杆。这种"鱼与熊掌兼得"的设计哲学,既解决了传统方法对硬件依赖的桎梏(HOG纯CPU运行),又通过模块化架构实现了从基础检测到人脸识别、姿态分析的生态延伸,堪称轻量级框架中兼顾速度与精度的典范。

相关推荐
可乐+冰016 分钟前
Android 编写高斯模糊功能
android·人工智能·opencv
嘀咕博客1 小时前
SynClub-百度在海外推出的AI社交产品
人工智能·百度·ai工具
AI算法工程师Moxi1 小时前
什么是迁移学习(transfer learning)
人工智能·机器学习·迁移学习
空白到白2 小时前
机器学习-KNN算法
人工智能·算法·机器学习
aliedudu2 小时前
机器学习概述
人工智能·机器学习
love you joyfully2 小时前
循环神经网络——pytorch实现循环神经网络(RNN、GRU、LSTM)
人工智能·pytorch·rnn·深度学习·gru·循环神经网络
袁庭新2 小时前
AI如何辅助创业?年轻人一定要创业
人工智能·创业
GIS开发特训营3 小时前
【智慧城市】2025年中国地质大学(武汉)暑期实训优秀作品(2):智慧城市西安与一带一路
人工智能·信息可视化·智慧城市
飞哥数智坊3 小时前
扣子实战第19讲:Coze零代码打造“新生入学百事通”,辅导员都说好
人工智能·coze
上海控安3 小时前
上海控安:GB 44495-2024《汽车整车信息安全技术要求》标准解读和测试方案
大数据·人工智能·汽车