论文阅读《Generalizing Face Forgery Detection with High-frequency Features》

发布时间：2024年01月10日

高频噪声分析会过滤掉图像的颜色内容信息。

本文设计了三个模块来充分利用高频特征，

1.多尺度高频特征提取模块

2.双跨模态注意模块

3.残差引导空间注意模块（也在一定程度上体现了两个模态的交互）

SRM是用于过滤图像的高频噪声

输入的图像X，共两个分支，一部分是用于输入到SRM获得高频特征Xh，一部分是RGB流，RGB的分支同样也会输入到SRM进行提取高频特征，其结果与已经输入SRM中的结果进行相加得到最后的输出结果 $^{F_{h}^{1}}$ ，和 $F_{}^{1}$ ，该过程经过不断地重复得到最后的特征F,和 $F_{h}$

第二个模块是DCMA，是跨模态的特征融合的部分，对于特征F来说，会先进行映射为Key 和value ，key用于计算两个模态的相似性，相似性结果再乘以权重矩阵得到系数C,再与Vh相乘得到特征T,对于T'的计算也是同样的道理，完成特征融合。

第三部分，将两个特征再通道维度上进行拼接，输入到全连接神经网络中，得到最后的分类结果。

文章来源:https://blog.csdn.net/weixin_56180495/article/details/135490724
本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若内容造成侵权/违法违规/事实不符，请联系我的编程经验分享网邮箱：chenni525@qq.com进行投诉反馈，一经查实，立即删除！