深度学习之对比学习

1.对比学习

主要解决如何学习表征、如何解决数据稀疏问题、如何利用无标签数据等

对比学习是一种自监督学习方法，侧重于通过对比正反两方面的实力来提取有意义的表征。在学习到的嵌入空间中，相似的实例应靠的更近，而不相似的实例离得更远。

对比学习通常从数据增强开始，这设计对未标记的数据应用各种转换或扰动以创建不同的实例或增强视图。

数据增强的目标是增加数据的可变性，并将模型暴露给同一实例的不同视角。常见的数据增强技术包括裁剪、翻转、旋转、随机裁剪和颜色变换。通过生成不同的实例，对比学习可确保模型学习捕获相关信息，而不管输入数据的变化如何。

特征提取器是对比学习模型的核心组件，负责从输入数据中提取高级特征表示。常见特征提取器包括：

ResNet :残差网络是深度学习中非常流行的架构之一，它通过引入残差链接解决了深度网络的梯度消失问题。

Inception:通过多尺度的卷积操作来捕获不同大小的特征，适合于复杂的图像特征。

EfficientNetL：这是一个高效网络结构，通过复合缩放的方法优化了网络的宽度、深度和分辨率，以达到更好的性能

在对比学习中，相似度计算式核心步骤之一，用于衡量不同样本之间的相似程度。余弦相似度常用于对比学习中的相似度计算，因为它受向量长度的影响，只关注方向。这使得它在特征表示学习中非常有用。

SimCLR：通过大量数据增强和对比学习，直接在特征表示上使用NT-Xent损失函数来最大化正样本对的相似性，最小化负样本的相似性。

MoCo：使用动量更新机制和一个队列来存储负样本，从而在有限的内存下提供大量的负样本对，提高对比学习的效果。

BYOL：通过两个编码器（在线编码器和目标编码器）之间的预测机制，不需要负样本对，直接优化在线编辑器的输出与目标编码器的输出指甲你的相似性。