【每日论文阅读】Do Perceptually Aligned Gradients Imply Robustness?

近似人眼梯度

https://icml.cc/virtual/2023/oral/25482

对抗性鲁棒分类器具有非鲁棒模型所没有的特征------感知对齐梯度(PAG)。它们相对于输入的梯度与人类的感知非常一致。一些研究已将 PAG 确定为稳健训练的副产品,但没有一篇研究将其视为一种独立现象,也没有研究其自身的影响。在这项工作中,我们关注这一特征并测试感知对齐梯度是否意味着鲁棒性。为此,我们制定了一个新的目标,在训练分类器中直接推广 PAG,并检查具有此类梯度的模型是否对对抗性攻击更稳健。对多个数据集和架构的大量实验验证了具有对齐梯度的模型表现出显着的鲁棒性,揭示了 PAG 和鲁棒性之间令人惊讶的双向联系。最后,我们表明更好的梯度对齐可以提高鲁棒性,并利用这一观察结果来提高现有对抗训练技术的鲁棒性。


噪音图-》目标类图。人言认同的方向走,因此是人言对齐梯度。


利用范数做

相关推荐
Marlowee4 小时前
UI-Ins 论文深度解读:Instruction-as-Reasoning 范式与 GUI Grounding 的多视角推理
论文阅读
赵庆明老师10 小时前
CSSCI论文写作14:如何用学术语言呈现论证
论文阅读·论文写作
StfinnWu11 小时前
论文阅读 Guided Real Image Dehazing Using YCbCr Color Space
论文阅读·计算机视觉
民乐团扒谱机12 小时前
【读论文】基于非线性光学的全光子人工神经网络处理器
论文阅读·笔记·论文
有Li15 小时前
SparseXMIL: 利用稀疏卷积实现数字病理学全玻片图像上下文感知和内存高效分类/文献速递-多模态医学影像最新进展
论文阅读·文献·医学生
西柚小萌新2 天前
【论文阅读】--MIRIX:面向多智能体的记忆系统
论文阅读
ccLianLian2 天前
论文阅读·多模态工作
论文阅读
网安INF2 天前
【论文阅读】-《Formalizing and Benchmarking Prompt Injection Attacks and Defenses》
论文阅读·大模型·prompt·ai安全
CV-杨帆2 天前
论文阅读:arxiv 2026 A Trajectory-Based Safety Audit of Clawdbot (OpenClaw)
论文阅读
张小泡泡2 天前
Graph Retrieval-Augmented Generation: A Survey
论文阅读·人工智能·rag·graphrag