人脸检测的若干思考!!!

1.目前主要有人脸检测方法分类?

主要包含两类:传统人脸检测算法和基于深度学习的人脸检测算法。

传统人脸检测算法主要可以分为4类: 基于知识、模型、特征和外观的人脸检测方法;

基于深度学习的方法:基于级联CNN的人脸检测(cascade cnn)、 基于多任务CNN的人脸检测(MTCNN)、Facebox等,很大程度上提高了人脸检测的鲁棒性。当然通用目标检测算法像Faster-rcnn、yolo、ssd等也有用在人脸检测领域,也可以实现比较不错的结果,但是和专门人脸检测算法比还是有差别。

2.如何检测图片中不同大小的人脸?

传统人脸检测算法的策略:

(1)缩放图片的大小(2)缩放滑动窗的大小

基于深度学习的人脸检测算法的策略:

(1)缩放图片大小。(也可以通过缩放滑动窗的方式,基于深度学习的滑动窗人脸检测方式效率会很慢存在多次重复卷积,所以要采用全卷积神经网络(FCN),用FCN将不能用滑动窗的方法。)

(2)通过anchor box的方法(通过特征图预测原图的anchor box区域)。

3.如何设定算法检测最小人脸尺寸?

主要是看滑动窗的最小窗口和anchorbox的最小窗口。

(1)滑动窗的方法

假设通过12×12的滑动窗,不对原图做缩放的话,就可以检测原图中12×12的最小人脸。但是往往通常给定最小人脸a=40、或者a=80,以这么大的输入训练CNN进行人脸检测不太现实,速度会很慢,并且下一次需求最小人脸a=30*30又要去重新训练,通常还会是12×12的输入,为满足最小人脸框a,只需要在检测的时候对原图进行缩放即可:w=w×12/a。

(2)anchorbox的方法

原理类似,这里主要看anchorbox的最小box,可以通过缩放输入图片实现最小人脸的设定。

4 如何定位人脸的位置?

1)滑动窗的方式:基于分类器识别为人脸的框的位置确定最终的人脸;

2)FCN的方式

通过特征图映射到原图的方式确定最终识别为人脸的位置,特征图映射到原图人脸框是要看特征图相比较于原图有多少次缩放(缩放主要查看卷积的步长和池化层)

3)通过anchor box的方式:

通过特征图映射到图的窗口,通过特征图映射到原图到多个框的方式确定最终识别为人脸的位置。

滑动窗的方式

5 如何通过一个人脸的多个框确定最终人脸框位置?

通过NMS得到最终的人脸位置:

NMS改进版本有很多,最原始的NMS就是判断两个框的交集,如果交集大于设定的阈值,将删除其中一个框,那么两个框应该怎么选择删除哪一个呢? 因为模型输出有概率值,一般会优选选择概率小的框删除。

相关推荐
__Wedream__10 小时前
ICMR2024 | 当对比学习遇上知识蒸馏:轻量超分模型压缩新框架
人工智能·深度学习·计算机视觉·知识蒸馏·超分辨率重建·对比学习
ComputerInBook12 小时前
数字图像处理(4版)——第 9 章——形态学图像处理(Rafael C.Gonzalez&Richard E. Woods)
图像处理·人工智能·计算机视觉·形态学·数学形态学
guo_xiao_xiao_13 小时前
YOLOv11果园果树苹果目标检测数据集-52张-apple-1_4
人工智能·yolo·目标检测
XingshiXu14 小时前
【NWAFU×KUL】不打扰,也能看懂一头牛:非接触式技术正在改变精准畜牧
人工智能·python·深度学习·目标检测·机器学习·计算机视觉·目标跟踪
Evand J14 小时前
课题介绍:基于 EKF 与 UKF 的二维雷达目标跟踪仿真与性能对比
人工智能·计算机视觉·目标跟踪
Matthew Um14 小时前
3D Face HRN实操手册:Gradio临时外网链接安全共享与访问权限控制
计算机视觉·3d人脸重建·ai建模
zhuiyisuifeng15 小时前
2026年AI图像生成:色彩语义理解新突破
人工智能·gpt·计算机视觉
懷淰メ16 小时前
【AI加持】基于PyQt+YOLO+DeepSeek的舌苔情况检测系统(详细介绍)
python·yolo·目标检测·计算机视觉·pyqt·舌苔
guo_xiao_xiao_16 小时前
YOLOv11家庭医疗场景创可贴目标检测数据集-60张-ban_aid-1
yolo·目标检测·目标跟踪
SylarXillee17 小时前
目标检测模型训练的邪修方法
目标检测·计算机视觉·视觉检测