ResEmoteNet论文阅读与推理

论文题目:ResEmoteNet: Bridging Accuracy and Loss Reduction in Facial Emotion Recognition

领域:面部情绪识别

数据集:​AffectNet​RAF-DBFER2013​ ExpW

模型架构:CNN+SE Block(Squeeze excitation) + Resnet+AAP

论文中的SE Block压缩激励结构如下:

ResEmoteNet的整体框架如下:

(1)CNN 模块,该模块具有三个卷积层,用于分层特征提取,然后进行批量归一化,以稳定学习并提高训练效率。在每一层之后应用 Max-pooling 以减少空间维度,降低计算成本并引入平移不变性以提高鲁棒性。

(2)SE模块,Squeeze使用全局平均池化将来自每个通道的空间数据压缩为全局描述符。 Excitation使用激活的门控机制来捕获通道依赖关系。SENet 的方法允许网络学习一系列注意力权重,突出每个输入元素对网络输出的重要性。

(3)残差Residual模块,解决神经网络中梯度消失和爆炸的常见问题。

(4)Adaptive Average Pooling(自适应平均池化) 是 CNN 中使用的一种池化层,无论原始输入维度如何,它都可以将输入信息聚合为恒定的输出大小。AAP 调整内核大小和步幅以达到特定的输出大小,而不是像传统的池化方法那样减小空间维度。它确保各种数据集和图层中的输出维度一致。

推理过程与结果:

GitHub:https://github.com/ArnabKumarRoy02/ResEmoteNet

下载预训练模型:ResEmoteNet Checkpoints - Google 云端硬盘

打开文件./eval_image.py,第16行代码:

python 复制代码
checkpoint = torch.load('path/to/fer2013_model.pth', weights_only=True,
                        map_location=torch.device('cpu'))

第80行代码:

python 复制代码
# Load the image file
image = cv2.imread('path/to/test1_image.jpg')

保存并运行该文件:

python 复制代码
python eval_image.py

测试图像是这个:

测试结果如下:

相关推荐
清风吹过15 小时前
LSTM新架构论文分享6:LSTM+Transformer融合
论文阅读·人工智能·深度学习·神经网络·lstm·transformer
DuHz18 小时前
汽车角雷达波形设计与速度模糊解决方法研究——论文阅读
论文阅读·物联网·算法·汽车·信息与通信·信号处理
有点不太正常18 小时前
Differentially Private Synthetic Text Generation for RAG——论文阅读
论文阅读·大模型·llm·rag
DuHz18 小时前
基于多普勒频率和距离变化率联合测量的增强型速度估计方法——论文阅读
论文阅读·目标检测·汽车·信息与通信·信号处理
墨绿色的摆渡人18 小时前
论文笔记(九十三)ManipulationNet: Benchmarking
论文阅读
bylander19 小时前
【论文阅读】REACT: SYNERGIZING REASONING AND ACTING IN LANGUAGE MODELS
论文阅读·语言模型·智能体
吃吃今天努力学习了吗2 天前
【论文阅读】Segment Any 3D Gaussians
论文阅读·3d·3dgs·三维分割
MoyiTech2 天前
【论文阅读】LANGUAGE MODELS CAN LEARN FROM VERBAL FEEDBACK WITHOUT SCALAR REWARDS
论文阅读·人工智能·语言模型
红苕稀饭6662 天前
LLaVA-OneVision论文阅读
论文阅读
CV-杨帆2 天前
论文阅读:arxiv 2025 Scaling Laws for Differentially Private Language Models
论文阅读·人工智能·语言模型