ResEmoteNet论文阅读与推理

论文题目:ResEmoteNet: Bridging Accuracy and Loss Reduction in Facial Emotion Recognition

领域:面部情绪识别

数据集:​AffectNet​RAF-DBFER2013​ ExpW

模型架构:CNN+SE Block(Squeeze excitation) + Resnet+AAP

论文中的SE Block压缩激励结构如下:

ResEmoteNet的整体框架如下:

(1)CNN 模块,该模块具有三个卷积层,用于分层特征提取,然后进行批量归一化,以稳定学习并提高训练效率。在每一层之后应用 Max-pooling 以减少空间维度,降低计算成本并引入平移不变性以提高鲁棒性。

(2)SE模块,Squeeze使用全局平均池化将来自每个通道的空间数据压缩为全局描述符。 Excitation使用激活的门控机制来捕获通道依赖关系。SENet 的方法允许网络学习一系列注意力权重,突出每个输入元素对网络输出的重要性。

(3)残差Residual模块,解决神经网络中梯度消失和爆炸的常见问题。

(4)Adaptive Average Pooling(自适应平均池化) 是 CNN 中使用的一种池化层,无论原始输入维度如何,它都可以将输入信息聚合为恒定的输出大小。AAP 调整内核大小和步幅以达到特定的输出大小,而不是像传统的池化方法那样减小空间维度。它确保各种数据集和图层中的输出维度一致。

推理过程与结果:

GitHub:https://github.com/ArnabKumarRoy02/ResEmoteNet

下载预训练模型:ResEmoteNet Checkpoints - Google 云端硬盘

打开文件./eval_image.py,第16行代码:

python 复制代码
checkpoint = torch.load('path/to/fer2013_model.pth', weights_only=True,
                        map_location=torch.device('cpu'))

第80行代码:

python 复制代码
# Load the image file
image = cv2.imread('path/to/test1_image.jpg')

保存并运行该文件:

python 复制代码
python eval_image.py

测试图像是这个:

测试结果如下:

相关推荐
诸葛思颖1 小时前
论文阅读笔记——NetLLM :当LLM遇上网络管理
论文阅读·笔记
CanCanCanedFish21 小时前
Transformer论文阅读笔记:从注意力机制到革命性架构的启示
论文阅读·笔记·transformer
大模型最新论文速读1 天前
06-02 · LLM 最新论文速览
论文阅读·人工智能·深度学习·机器学习·自然语言处理
Rocky Ding*2 天前
深入浅出完整解析AIGC时代中GAN(Generative Adversarial Network)系列模型核心基础知识(下篇)
论文阅读·人工智能·深度学习·机器学习·aigc·gan·ai-native
chnyi6_ya3 天前
论文阅读笔记|Wan: Open and Advanced Large-Scale Video Generative Models
论文阅读·笔记
chnyi6_ya4 天前
论文阅读:CogVideoX: Text-to-Video Diffusion Models with An Expert Transformer
论文阅读·深度学习·transformer
大模型最新论文速读4 天前
SkillOpt:把 skill 文档当成模型权重来训练
论文阅读·人工智能·深度学习·机器学习·自然语言处理
Cloud_Shy6184 天前
解读《Effective Python 3rd Edition》:从练气到老魔(第一章 Item 4 - 6)
android·数据库·论文阅读·python
Rocky Ding*5 天前
一文读懂HiDream-I1稀疏 DiT 图像生成基础模型
论文阅读·人工智能·深度学习·机器学习·ai作画·aigc·ai-native
锅挤5 天前
来一篇儿:《anish into Thin Air: Cross-prompt Universal Adversarial Attacks for SAM2》
论文阅读