FD-Align论文阅读

FD-Align: Feature Discrimination Alignment for Fine-tuning Pre-Trained Models in Few-Shot Learning（NeurIPS 2023）

主要工作是针对微调的和之前的prompt tuining，adapter系列对比

Motivation：

通过模型对虚假关联性的鲁棒性来解释全微调的CLIP的out-of-distribution(OOD)性能变差的原因。虚假关联性的鲁棒性指的是模型是否具有区分出样本中和类别相关信息（因果信息）以及（背景、风格等）类别无关信息（虚假信息）的能力。

先前的工作发现，OPENAI 的CLIP对虚假关联性有很好的鲁棒性，因此有很好的OOD性能。然而，全微调的CLIP的OOD性能会下降。对CLIP和全微调后的CLIP的attention map可视化后发现：全微调的CLIP更关注于物体的局部特征，这种对局部信息的注意力使得模型对虚假关联性的鲁棒性变差[3]。

也就是说，对CLIP进行全微调时，虽然模型更好得学习到了微调样本的因果特征，但是模型对虚假特征的识别能力也变差，导致模型学习到的因果特征不能很好的泛化到未见过样本 。从而出现过拟合，影响OOD数据上的泛化性。因此，本文提出了一种不影响模型对虚假特征识别能力的微调方法来保证微调后的模型对虚假关联性的鲁棒性。