论文阅读《Generalizing Face Forgery Detection with High-frequency Features》

高频噪声分析会过滤掉图像的颜色内容信息。

本文设计了三个模块来充分利用高频特征,

1.多尺度高频特征提取模块

2.双跨模态注意模块

3.残差引导空间注意模块(也在一定程度上体现了两个模态的交互)

SRM是用于过滤图像的高频噪声

输入的图像X,共两个分支,一部分是用于输入到SRM获得高频特征Xh,一部分是RGB流,RGB的分支同样也会输入到SRM进行提取高频特征,其结果与已经输入SRM中的结果进行相加得到最后的输出结果,和,该过程经过不断地重复得到最后的特征F,和

第二个模块是DCMA,是跨模态的特征融合的部分,对于特征F来说,会先进行映射为Key 和value ,key用于计算两个模态的相似性,相似性结果再乘以权重矩阵得到系数C,再与Vh相乘得到特征T,对于T'的计算也是同样的道理,完成特征融合。

第三部分,将两个特征再通道维度上进行拼接,输入到全连接神经网络中,得到最后的分类结果。

相关推荐
有Li6 小时前
解剖学引导的全身PET-CT乳腺癌分割与跨模态自对齐/文献速递-基于深度学习的图像配准与疾病诊断
论文阅读·人工智能·深度学习·文献·医学生
s1ckrain6 小时前
【论文阅读】Towards Learning a Generalist Model for Embodied Navigation
论文阅读·多模态·具身智能
有Li17 小时前
用于CBCT到CT合成的纹理保留扩散模型/文献速递-基于人工智能的医学影像技术
论文阅读·人工智能·深度学习·计算机视觉·文献
CV-杨帆1 天前
论文阅读:arixv 2026 Reasoning Models Generate Societies of Thought
论文阅读
YMWM_1 天前
论文阅读“MV-UMI: A Scalable Multi-View Interface for Cross-Embodiment Learning“
论文阅读·umi
YMWM_2 天前
论文阅读“Tactile-reactive gripper with an active palm for dexterous manipulation“
论文阅读·palm·tactile gripper
CV-杨帆2 天前
论文阅读:2026 techrxiv Jailbreak-as-a-Service: The Emerging Threat Landscape
论文阅读
张较瘦_3 天前
[论文阅读] 软件测试 | 跨语言模糊测试大揭秘:C++/Rust/Python谁更胜一筹?
c++·论文阅读·rust
青衫码上行3 天前
Redis常用数据类型操作命令
java·数据库·论文阅读·redis·学习
蓝田生玉1234 天前
qwen论文阅读笔记
论文阅读·笔记