【IQA技术专题】多维度注意力IQA：MANIQA

PixelMind2025-12-08 14:31

多维度注意力IQA：MANIQA（2022 CVPR）

专题介绍
一、研究背景
二、MANIQA方法
- [2.1 Transposed Attention Block](#2.1 Transposed Attention Block)
- [2.2 Scale Swin Transformer Block](#2.2 Scale Swin Transformer Block)
- [2.3 Patch-weighted Quality Prediction](#2.3 Patch-weighted Quality Prediction)
三、实验
四、总结

本文将围绕《MANIQA: Multi-dimension Attention Network for No-Reference Image Quality Assessment》展开完整解析。

论文提出了多维度注意力网络（MANIQA）用于无参考图像质量评估（NR-IQA），旨在解决现有方法在 GAN 生成失真图像上评估性能不足的问题。该模型以ViT 为特征提取器，通过转置注意力块（TAB）增强通道间全局交互、尺度 Swin Transformer 块（SSTB）强化斑块间局部交互，并采用斑块加权双分支预测结构输出最终质量分数。实验表明，MANIQA 在 LIVE、TID2013 等 4 个标准数据集上大幅超越现有最优方法，且在NTIRE 2022 NR-IQA 挑战赛中排名第一，展现出优异的泛化能力和对 GAN 失真图像的评估效果。参考资料如下：