【每日论文阅读】Do Perceptually Aligned Gradients Imply Robustness?

近似人眼梯度

https://icml.cc/virtual/2023/oral/25482

对抗性鲁棒分类器具有非鲁棒模型所没有的特征------感知对齐梯度(PAG)。它们相对于输入的梯度与人类的感知非常一致。一些研究已将 PAG 确定为稳健训练的副产品,但没有一篇研究将其视为一种独立现象,也没有研究其自身的影响。在这项工作中,我们关注这一特征并测试感知对齐梯度是否意味着鲁棒性。为此,我们制定了一个新的目标,在训练分类器中直接推广 PAG,并检查具有此类梯度的模型是否对对抗性攻击更稳健。对多个数据集和架构的大量实验验证了具有对齐梯度的模型表现出显着的鲁棒性,揭示了 PAG 和鲁棒性之间令人惊讶的双向联系。最后,我们表明更好的梯度对齐可以提高鲁棒性,并利用这一观察结果来提高现有对抗训练技术的鲁棒性。


噪音图-》目标类图。人言认同的方向走,因此是人言对齐梯度。


利用范数做

相关推荐
DuHz2 小时前
基于信号分解的FMCW雷达相互干扰抑制——论文阅读
论文阅读·算法·汽车·信息与通信·毫米波雷达
m0_650108248 小时前
MiniGPT-4:解锁 LLM 驱动的高级视觉语言能力
论文阅读·开源·视觉语言大模型·minigpt-4·跨模态对齐·强llm+视觉对齐
WSKH09299 小时前
【论文阅读】(2016)Dual Inequalities for Stabilized Column Generation Revisited
论文阅读·线性规划·运筹学·列生成·对偶不等式·稳定列生成
程途拾光15812 小时前
用流程图优化工作流:快速识别冗余环节,提升效率
大数据·论文阅读·人工智能·流程图·论文笔记
蓝海星梦14 小时前
【论文笔记】R-HORIZON:重塑长周期推理评估与训练范式
论文阅读·人工智能·深度学习·自然语言处理·大型推理模型
张较瘦_14 小时前
[论文阅读] 软件工程 | 解决Java项目痛点:DepUpdater如何平衡依赖升级的“快”与“稳”
java·开发语言·论文阅读
0x21114 小时前
[论文阅读]Friend or Foe: How LLMs‘ Safety Mind Gets Fooled by Intent Shift Attack
论文阅读
Valueyou2414 小时前
论文阅读——CenterNet
论文阅读·python·opencv·目标检测·计算机视觉
谷谷谷雨1 天前
SRv6论文阅读
论文阅读
CV炼丹术1 天前
AAAI 2026|港科大等提出ReconVLA:利用视觉重构引导,刷新机器人操作精度!(含代码)
论文阅读·计算机视觉·重构·机器人·aaai 2026