YOLO5Face算法解读

论文:YOLO5Face: Why Reinventing a Face Detector

链接:https://arxiv.org/abs/2105.12931v1

机构:深圳神目科技&LinkSprite Technologies(美国)

开源代码:https://github.com/deepcam-cn/yolov5-face

目录

1、算法概述

作者在yolov5通用目标检测器的基础上做了针对性改进,使得利用yolov5的主体框架来检测人脸。对yolov5的关键性修改如下:

  • (1)、在 YOLOv5 网络中加了一个关键点 regression head。损失函数用 Wing loss。
  • (2)、用 Stem 块结构取代 YOLOv5 的 Focus 层。增加了网络的泛化能力,并降低了计算的复杂性,同时性能也没有下降。
  • (3)、对 SPP 块进行了改变,使用一个更小的 kernel(内核)。促使 YOLOv5 更适合于人脸检测,并提高检测精度。
  • (4)、增加一个 stride 为 64 的 P6 输出块。可以增加检测大型人脸的能力。
  • (5)、作者发现,一些用于一般目标检测的数据增强方法并不适合用于人脸检测,包括 up-down flipping 和 Mosaic。去除 up-down flipping 性能会改善。当使用小图像时,Mosaic 增强法会降低性能。然而,当小脸被忽略时,它的效果很好。随机剪裁有助于提高性能。
  • (6)、设计两个基于 ShuffleNetV2 的超轻量级模型。其骨干网与 CSP 网络大不相同。这些模型超级小,同时实现了嵌入式或移动设备的 SOTA 性能。
    整体网络结构如下:

    其中图中红色部分为作者基于yolov5结构做的修改。
    Stem用于替换原来yolov5结构中的focus层,其结构如下:

2、实验结果

作者用WiderFace人脸库训练,用FDDB数据库作为测试。和现在最近的人脸检测器比对,其结果如下:

3、算法特点

Yolov5检测算法,它是通用目标检测算法,人脸检测是其中一个特殊情况,人脸检测有其特殊性,比如长宽比1:1,可以增加关键点辅助训练等。

相关推荐
岁忧11 分钟前
(LeetCode 每日一题) 3541. 找到频率最高的元音和辅音 (哈希表)
java·c++·算法·leetcode·go·散列表
pusue_the_sun19 分钟前
每日算法题推送
算法·双指针
KyollBM33 分钟前
【Luogu】P9809 [SHOI2006] 作业 Homework (根号算法)
算法
jmxwzy38 分钟前
leetcode274.H指数
算法
纪元A梦1 小时前
贪心算法应用:信用评分分箱问题详解
java·算法·贪心算法
过河卒_zh15667662 小时前
9.13AI简报丨哈佛医学院开源AI模型,Genspark推出AI浏览器
人工智能·算法·microsoft·aigc·算法备案·生成合成类算法备案
D.....l2 小时前
冒泡排序与选择排序以及单链表与双链表
数据结构·算法·排序算法
sinat_286945193 小时前
Case-Based Reasoning用于RAG
人工智能·算法·chatgpt
Athenaand3 小时前
代码随想录算法训练营第50天 | 图论理论基础、深搜理论基础、98. 所有可达路径、广搜理论基础
算法·图论