【每日论文阅读】Do Perceptually Aligned Gradients Imply Robustness?

近似人眼梯度

https://icml.cc/virtual/2023/oral/25482

对抗性鲁棒分类器具有非鲁棒模型所没有的特征------感知对齐梯度(PAG)。它们相对于输入的梯度与人类的感知非常一致。一些研究已将 PAG 确定为稳健训练的副产品,但没有一篇研究将其视为一种独立现象,也没有研究其自身的影响。在这项工作中,我们关注这一特征并测试感知对齐梯度是否意味着鲁棒性。为此,我们制定了一个新的目标,在训练分类器中直接推广 PAG,并检查具有此类梯度的模型是否对对抗性攻击更稳健。对多个数据集和架构的大量实验验证了具有对齐梯度的模型表现出显着的鲁棒性,揭示了 PAG 和鲁棒性之间令人惊讶的双向联系。最后,我们表明更好的梯度对齐可以提高鲁棒性,并利用这一观察结果来提高现有对抗训练技术的鲁棒性。


噪音图-》目标类图。人言认同的方向走,因此是人言对齐梯度。


利用范数做

相关推荐
红苕稀饭6662 分钟前
LLaVA-OneVision论文阅读
论文阅读
CV-杨帆7 小时前
论文阅读:arxiv 2025 Scaling Laws for Differentially Private Language Models
论文阅读·人工智能·语言模型
红苕稀饭66610 小时前
LLaVA-Video论文阅读
论文阅读
铮铭10 小时前
【论文阅读】具身竞技场:面向具身智能的全面、统一、演进式评估平台
论文阅读·人工智能·机器人·世界模型
七元权12 小时前
论文阅读-FoundationStereo
论文阅读·深度学习·计算机视觉·零样本·基础模型·双目深度估计
berling0017 小时前
【论文阅读 | TCSVT 2024 | CCAFusion: 用于红外与可见光图像融合的跨模态坐标注意力网络】
论文阅读
0x21117 小时前
[论文阅读]Dataset Protection via Watermarked Canaries in Retrieval-Augmented LLMs
论文阅读
bylander17 小时前
【论文阅读】通义实验室,VACE: All-in-One Video Creation and Editing
论文阅读·人工智能·计算机视觉·音视频
飞机火车巴雷特17 小时前
【论文阅读】Debating with More Persuasive LLMs Leads to More Truthful Answers
论文阅读·大模型·辩论机制
红苕稀饭66617 小时前
LLAVA-MINI论文阅读
论文阅读