【每日论文阅读】Do Perceptually Aligned Gradients Imply Robustness?

近似人眼梯度

https://icml.cc/virtual/2023/oral/25482

对抗性鲁棒分类器具有非鲁棒模型所没有的特征------感知对齐梯度(PAG)。它们相对于输入的梯度与人类的感知非常一致。一些研究已将 PAG 确定为稳健训练的副产品,但没有一篇研究将其视为一种独立现象,也没有研究其自身的影响。在这项工作中,我们关注这一特征并测试感知对齐梯度是否意味着鲁棒性。为此,我们制定了一个新的目标,在训练分类器中直接推广 PAG,并检查具有此类梯度的模型是否对对抗性攻击更稳健。对多个数据集和架构的大量实验验证了具有对齐梯度的模型表现出显着的鲁棒性,揭示了 PAG 和鲁棒性之间令人惊讶的双向联系。最后,我们表明更好的梯度对齐可以提高鲁棒性,并利用这一观察结果来提高现有对抗训练技术的鲁棒性。


噪音图-》目标类图。人言认同的方向走,因此是人言对齐梯度。


利用范数做

相关推荐
大模型最新论文速读6 小时前
05-29 · LLM 最新论文速览
论文阅读·人工智能·深度学习·机器学习·自然语言处理
森诺Alyson1 天前
前沿技术借鉴研讨-2026.5.28(眼动数据预测抑郁&自杀倾向)
论文阅读·人工智能·深度学习·分类·论文笔记
凌晨一点的秃头猪2 天前
GR2(Generative Reasoning Reranker,生成式推理重排器)论文阅读
论文阅读
Biomamba生信基地2 天前
《Advanced Science》前沿工具发布:STAID,空间反卷积自优化深度学习框架
论文阅读·深度学习·生物信息学·模型训练
仙女修炼史3 天前
CNN更看重Texture还是shape:imagenet-trained cnns are biased
论文阅读·人工智能·cnn
大模型最新论文速读4 天前
GRPO 丢失的组内排序信息,LamPO 补回来了
论文阅读·人工智能·深度学习·机器学习·自然语言处理
Rocky Ding*4 天前
深入浅出讲解ERNIE-Image图像创作大模型
论文阅读·人工智能·深度学习·机器学习·ai作画·aigc·ai-native
小马哥crazymxm5 天前
Arxiv论文周选 (2026-W21)
论文阅读·人工智能·考研
传说故事6 天前
【论文阅读】MEM: Multi-Scale Embodied Memory for Vision Language Action Models
论文阅读·人工智能·具身智能·vla
传说故事7 天前
【论文阅读】VGGT-Ω
论文阅读·人工智能·3d·具身智能