OpenCv高阶(十八)——dlib人脸检测与识别

文章目录


一、dlib库是什么?

dlib是一个适用于C++和Python的第三方库。包含机器学习、计算机视觉和图像处理的工具包,被广泛的应用于机器人、嵌入式设备、移动电话和大型高性能计算环境。是开源许可用户免费使用。

二、opencv库与dlib库的优缺点对比

1、opencv优缺点

优点

1)可以在CPU上实时工作;

2)简单的架构;

3)可以检测不同比例的人脸。

缺点

1)会出现大量的把非人脸预测为人脸的情况;

2)不适用于非正面人脸图像;

3)不抗遮挡。

2、dlib库优缺点

优点

1)适用于正面和略微非正面的人脸;

2)语法极简单

3)再小的遮挡下仍可工作。

缺点

1)不能检测小脸,因为它训练数据的最小人脸尺寸为80×80,较小尺寸的人脸数据需自己训练检测器;

2)边界框通常排除前额的一部分甚至下巴的一部分;

3)不适用于侧面和极端非正面,如俯视或仰视。

三、dlib库的安装

1、在线安装

python 复制代码
pip install dlib --i 镜像地址

dlib官网:https://dlib.net/compile.html

2、本地安装

找到dlib库的whl文件进行安装,将whl文件下载到本地安装。

dlib资源: https://github.com/z-mahmud22/Dlib_Windows_Python3.x

四、dlib库的人脸检测器

dlib 提供 两种主流人脸检测器,适用于不同场景:

1. 基于 HOG 的检测器

python 复制代码
detector = dlib.get_frontal_face_detector()  # 默认使用此方法

算法原理:

使用 方向梯度直方图 (HOG) 特征描述图像局部区域的梯度方向分布

结合 线性分类器 (SVM) 进行人脸判别

通过 图像金字塔 和 滑动窗口 实现多尺度检测

特点:

✅ 速度快:适合实时检测(CPU 上可达 30+ FPS)

✅ 轻量级:模型文件小(约 2MB)

⚠️ 局限性:对侧脸、遮挡人脸检测效果较差

2. 基于 CNN 的检测器

python 复制代码
cnn_detector = dlib.cnn_face_detection_model_v1("mmod_human_face_detector.dat")

算法原理:

使用 卷积神经网络 (CNN) 进行端到端的人脸检测

需要预训练权重文件(需单独下载)

特点:

✅ 高精度:对侧脸、部分遮挡、复杂背景鲁棒性强

⚠️ 资源消耗大:需要 GPU 加速(CPU 上较慢)

⚠️ 模型文件较大(约 200MB)

五、dlib人脸检测的简单使用

1、导入必要库

python 复制代码
import cv2       # OpenCV库,用于图像处理和显示
import dlib      # 机器学习库,用于人脸特征检测

2、初始化人脸检测器

python 复制代码
# 使用dlib内置的基于HOG特征的方向梯度直方图人脸检测器
# 该检测器对正脸检测效果较好,返回人脸矩形坐标
detector = dlib.get_frontal_face_detector()

3、读取图像文件

python 复制代码
# 从指定路径加载图像文件,OpenCV默认读取为BGR格式
img = cv2.imread("../data/pd.png")  

4、执行人脸检测

python 复制代码
# 参数说明:
# 1. 输入图像(img)
# 2. 图像放大系数(4):通过上采样图像4次来检测更小的人脸
# 返回值:dlib.rectangle对象组成的可迭代对象,包含人脸区域坐标
faces = detector(img, 4)  

5、 遍历检测结果并标注

python 复制代码
for face in faces:
    # 解析人脸矩形坐标:
    x1 = face.left()   # 人脸框左侧x坐标
    y1 = face.top()    # 人脸框顶部y坐标
    x2 = face.right()  # 人脸框右侧x坐标
    y2 = face.bottom() # 人脸框底部y坐标
    
    # 在图像上绘制绿色矩形框标注人脸
    # 参数说明:
    # 1. 目标图像
    # 2. 左上角坐标 (x1, y1)
    # 3. 右下角坐标 (x2, y2)
    # 4. 颜色 (BGR格式,此处为绿色)
    # 5. 线宽(2像素)
    cv2.rectangle(img, (x1, y1), (x2, y2), (0, 255, 0), 2)

6、显示检测结果

python 复制代码
cv2.imshow('Face Detection Result', img)  # 创建显示窗口
cv2.waitKey(0)            # 等待任意按键(0表示无限等待)
cv2.destroyAllWindows()   # 关闭所有OpenCV窗口

总结

Dlib的人脸检测技术通过提供双引擎解决方案,在计算机视觉领域展现了独特的平衡艺术:其HOG检测器以轻量高效的特性(2MB模型、30+ FPS实时性)成为移动端和实时视频的首选,而CNN检测器凭借深度学习带来的高精度(支持多角度、复杂光照),在静态图像分析中树立了行业标杆。这种"鱼与熊掌兼得"的设计哲学,既解决了传统方法对硬件依赖的桎梏(HOG纯CPU运行),又通过模块化架构实现了从基础检测到人脸识别、姿态分析的生态延伸,堪称轻量级框架中兼顾速度与精度的典范。

相关推荐
武子康2 分钟前
大数据-273 Spark MLib - 基础介绍 机器学习算法 决策树 分类原则 分类原理 基尼系数 熵
大数据·人工智能·算法·决策树·机器学习·spark-ml
JINX的诅咒3 分钟前
FPGA实现CNN卷积层:高效窗口生成模块设计与验证
人工智能·fpga开发·cnn
2301_7875528722 分钟前
node-DeepResearch开源ai程序用于深入调查查询,继续搜索、阅读网页、推理,直到找到答案
人工智能·开源
struggle202533 分钟前
SPEAR开源程序是用于逼真演示 AI 研究的模拟器
人工智能·开源
云空37 分钟前
《ChatGPT o3抗命:AI失控警钟还是成长阵痛?》
人工智能·深度学习·神经网络·机器学习·chatgpt
蹦蹦跳跳真可爱58943 分钟前
Python----神经网络(基于ResNet的汽车分类)
人工智能·python·深度学习·神经网络·汽车
新中地GIS开发老师1 小时前
25年GIS开发暑期实训营,15天Get三维可视化智慧城市开发项目
前端·人工智能·智慧城市·web·gis开发·webgis·地信
IT科技那点事儿1 小时前
Accelerate 2025北亚巡展正式启航!AI智御全球·引领安全新时代
人工智能·安全
AI街潜水的八角1 小时前
手写字魔法消除3:深度学习PmrNet神经网络实现图片修复(含训练代码、数据集和GUI交互界面)
人工智能·深度学习·神经网络
肥猪猪爸1 小时前
使用LSTM进行时间序列分析
数据结构·人工智能·rnn·深度学习·算法·lstm·时间序列分析