【论文阅读】Reconstructive Neuron Pruning for Backdoor Defense我们的主要贡献包括:我们提出了一种名为“重构神经元剪枝”(Reconstructive Neuron Pruning,RNP)的新方法,通过“遗忘”和“恢复”神经元的过程来暴露和剪枝后门神经元。具体而言,给定一个被后门攻击的模型,RNP首先通过梯度上升最大化模型在干净样本上的误差来“遗忘”模型,然后通过最小化模型在相同样本上的误差来“恢复”(重新学习)神经元。有趣的是,我们发现,如果“遗忘”在神经元级别进行,而“恢复”在过滤器级别进行,那么网络倾向于重新定位后门神经元,以补偿因“遗忘”而失去的干净特征造成