Person Re-Identification(Re-ID)的分类

行人重识别(Person Re-Identification, Re-ID)是计算机视觉和深度学习中的一个重要任务,旨在通过图像或视频中的行人外观信息来识别和追踪同一个人在不同摄像头视角下的出现。根据任务的不同,行人重识别可以分为以下几类:整体行人重识别(Holistic Person Re-ID)、局部行人重识别(Partial Re-ID)和遮挡行人重识别(Occluded Person Re-ID)。

1.整体行人重识别(Holistic Person Re-ID)

1.1定义

整体行人重识别是最基础和标准的行人重识别任务。其假设行人在图像中的全身是清晰可见的,没有被遮挡或部分缺失。目标是通过行人的全身图像来进行识别。

1.2解决方法
  1. 深度学习模型:通常使用深度卷积神经网络(CNN)来提取行人的特征表示。常用的网络架构有ResNet、DenseNet等。
  2. 特征学习:通过监督学习方式,从大规模标注数据集中学习行人特征。采用交叉熵损失(Cross-Entropy Loss)和三元组损失(Triplet Loss)等损失函数。
  3. 数据增强:使用数据增强技术,如随机裁剪、水平翻转和颜色抖动等,来增加训练数据的多样性,提升模型的泛化能力。
  4. 度量学习:利用度量学习方法,如欧氏距离、余弦相似度等,来计算查询图像和候选图像之间的相似度。
1.3相关方法和算法
  • BOW+KISSME:基于颜色直方图和纹理特征的传统方法。
  • LOMO+XQDA:基于局部最大化发生(LOMO)特征和交叉视角判别分析(XQDA)的经典方法。
  • 深度学习模型:如DeepPerson、PCB(Part-based Convolutional Baseline)等。

2.局部行人重识别(Partial Re-ID)

2.1定义

局部行人重识别指在图像中只有行人的部分可见,而非整个身体。这种情况常见于行人被部分遮挡、图像裁剪或行人位于图像边缘等情况。

2.2解决方法
  1. 局部特征提取:设计能够从局部图像中提取有效特征的模型。如局部对齐网络(Part-Aligned Networks),通过对齐和分区来提取局部特征。
  2. 分块匹配:将图像划分为多个部分,分别提取每个部分的特征,并进行匹配。常见方法有局部特征池化(Part-based Pooling)和局部对齐。
  3. 多尺度特征融合:结合不同尺度的特征,增强对局部特征的捕捉能力。如使用金字塔特征网络(Feature Pyramid Networks, FPN)等。
  4. 注意力机制:通过注意力机制自适应地选择图像中的关键区域,忽略背景噪声。常用方法有自注意力(Self-Attention)和非局部注意力(Non-Local Attention)。
2.3相关方法和算法
  • DSR:基于深度分区和重构的部分行人重识别方法。
  • DFPN:动态特征金字塔网络,结合不同尺度的特征进行重识别。
  • PVPM:部分可视性预测模型,预测行人图像中可见的部分并进行匹配。

3.遮挡行人重识别(Occluded Person Re-ID)

3.1定义

遮挡行人重识别是指行人在图像中被其他物体或行人部分遮挡的情况。这种情况在现实场景中非常常见,如行人被树木、车辆或其他行人挡住。

3.2解决方法
  1. 遮挡检测和处理:先检测图像中的遮挡部分,然后对非遮挡部分进行特征提取和匹配。如Mask Re-ID模型,通过分割网络来检测遮挡部分。
  2. 鲁棒特征提取:设计对遮挡具有鲁棒性的特征提取方法,如使用局部特征池化(Local Feature Pooling)和稀疏表示。
  3. 对抗训练:通过生成对抗网络(GAN)生成遮挡样本,并通过对抗训练提升模型对遮挡的鲁棒性。
  4. 图注意力网络:使用图卷积网络(GCN)结合注意力机制,增强对非遮挡部分特征的学习。
3.3相关方法和算法
  • HACNN:基于自注意力卷积神经网络的遮挡行人重识别方法。
  • PGFA:部分引导特征对齐网络,通过对齐非遮挡部分的特征进行重识别。
  • HOReID:基于高阶特征学习的遮挡行人重识别方法,使用姿态估计和局部特征对齐技术。

4.关系与总结

整体行人重识别、局部行人重识别和遮挡行人重识别是行人重识别任务中的不同场景。整体行人重识别是基础,其假设最为理想,行人全身可见。局部行人重识别和遮挡行人重识别是对更复杂场景的扩展,针对部分可见和被遮挡的行人进行识别。解决这些问题的方法包括特征提取、数据处理、模型设计和损失函数优化等,目标是提升模型在不同复杂场景下的鲁棒性和识别准确率。

相关推荐
强哥之神2 分钟前
Nexa AI发布OmniAudio-2.6B:一款快速的音频语言模型,专为边缘部署设计
人工智能·深度学习·机器学习·语言模型·自然语言处理·音视频·openai
yusaisai大鱼6 分钟前
tensorflow_probability与tensorflow版本依赖关系
人工智能·python·tensorflow
18号房客7 分钟前
一个简单的深度学习模型例程,使用Keras(基于TensorFlow)构建一个卷积神经网络(CNN)来分类MNIST手写数字数据集。
人工智能·深度学习·机器学习·生成对抗网络·语言模型·自然语言处理·tensorflow
神秘的土鸡14 分钟前
神经网络图像隐写术:用AI隐藏信息的艺术
人工智能·深度学习·神经网络
数据分析能量站15 分钟前
神经网络-LeNet
人工智能·深度学习·神经网络·机器学习
Jaly_W23 分钟前
用于航空发动机故障诊断的深度分层排序网络
人工智能·深度学习·故障诊断·航空发动机
小嗷犬26 分钟前
【论文笔记】Cross-lingual few-shot sign language recognition
论文阅读·人工智能·多模态·少样本·手语翻译
夜幕龙32 分钟前
iDP3复现代码数据预处理全流程(二)——vis_dataset.py
人工智能·python·机器人
吃个糖糖1 小时前
36 Opencv SURF 关键点检测
人工智能·opencv·计算机视觉
AI慧聚堂1 小时前
自动化 + 人工智能:投标行业的未来是什么样的?
运维·人工智能·自动化