人工智能应用-机器视觉:人脸识别(6)深度神经网络方法

近年来,深度神经网络在人脸识别中表现出了卓越的性能。与基于人为特征设计的方法相比,深度神经网络可以从原始图片中逐层提取人脸信息,从而获得与人脸相关的抽象特征。这种层次性特征学习避免了人为特征设计的缺陷,特别是在训练数据足够丰富时表现更为出色。

基于深度卷积网络的人脸识别系统。图片来源:Sun et al., 2022.

图 是一个用于人脸识别的深度卷积网络。输入的是原始的人像图片。首先对人脸进行定位,再通过一个三维模型将侧脸转换成正脸。将转换后的人脸图片输入一个包含 6 个卷积层的神经网络,最后经过两个全连接层后到达输出层。输出层的每个节点对应一个特定的人。学习的准则如下:输出层对应目标人的节点输出接近 1,而其他节点的输出接近 0

训练完成后,网络会在底层检测简单的线条和边缘,在中间层识别出五官等人脸部件,而在高层则能够提取出整张人脸的抽象特征。

人脸识别网络各层卷积核学到的特征。图片来源:Wang et al., 2019.

这种逐步递进的学习方式,使得深度神经网络在最后一个隐藏层得到一个可以全面表达人脸独特性的向量,这一向量被视为人脸在低维空间中的"嵌入"(Embedding)。通过计算这些特征向量之间的距离(一般为余弦距离),就可以判断两张人脸图片之间的相似度,进而决定两张人脸图片是否属于同一个人。自 2014 年深度神经网络首次应用于人脸识别以后,人脸识别的精度快速提高。在 LFW(Labelled Faces in the Wild)数据集上,深度学习模型很快取得了超过99% 的识别准确率,达到了实用化水平。

神经网络将人脸图片嵌入到一个低维人脸空间,两张人脸图片这一空间中的距离代表了它们的相似度。

相关推荐
蔚天灿雨几秒前
Kage:在 Codex、Claude 和 QoderCLI 等 CodingAgentCLI 之间 Fork 与迁移 Session
人工智能·ai·agent·ai编程
no_work8 分钟前
yolo摄像头下的目标检测识别集合
人工智能·深度学习·yolo·目标检测·计算机视觉
一只叫煤球的猫13 分钟前
为什么不用 RAG 做记忆系统 ——压缩上下文与 memory.md 的架构选择
人工智能·后端·ai编程
智能工业品检测-奇妙智能20 分钟前
国产化系统的性价比对比
人工智能·spring boot·后端·openclaw·奇妙智能
咚咚王者21 分钟前
人工智能之语言领域 自然语言处理 第十九章 深度学习框架
人工智能·深度学习·自然语言处理
独隅23 分钟前
Python AI 全面使用指南:从数据基石到智能决策
开发语言·人工智能·python
啊巴矲25 分钟前
小白从零开始勇闯人工智能:机器学习汇总(复习大纲篇)
人工智能
耶叶28 分钟前
如何在AndroidStudio里面接入你的AI助手
人工智能·android-studio
OpenBayes贝式计算29 分钟前
教程上新丨基于 GPU 部署 OpenClaw,轻松接入飞书/Discord 等社交软件
人工智能·深度学习·机器学习
小超同学你好38 分钟前
Langgraph 17. Skills 三级加载与 Token 优化(含代码示例)
人工智能·语言模型·langchain