用于物体识别和跟踪的下游任务自监督学习-2-(计算机视觉中的距离度量+损失函数)

2.4 计算机视觉中的距离度量

在深度学习和计算机视觉中,距离度量通常用于比较图像、视频或其他数据的特征或嵌入。根据具体任务和数据属性,可以使用不同类型的距离度量。下面介绍了深度学习和计算机视觉中使用的一些常见类型的距离度量。

余弦相似性距离:余弦相似性测量向量空间模型(VSM)中两个向量之间的距离。余弦相似性Sc(τa,τp)和两个向量τa和τp之间对应的余弦距离Dc(τa、τp)可以定义如下2.6式子

软余弦相似距离是自然语言处理中提出的传统余弦距离[61]的修改版本,它考虑了余弦距离中两个特征向量之间的相似性。

如果τai和τpj之间没有相似性,则对于i 6=j和sii=1,sij=0,这减少到传统的余弦相似距离Dc(等式2.6)

Mahalanobis距离:Mahalano比斯距离测量点和分布之间的距离。与欧几里得距离不同Mahalanobis 30距离考虑了变量之间的相关性。在这个度量中,每个变量根据其相关性对距离做出贡献。x∈Rp和p变量分布fx(.)的平均值µ=E(x)之间的马氏距离D(x,µ)可以定义为

对于单位协方差矩阵,Mahalanobis距离变为欧几里得距离。

豪斯多夫距离(Hausdorff Distance):豪斯多夫距离度量测量两组点之间的相似性,并定义为一组点中任意点与另一组点之间最接近点之间的最高距离。两组点τa和τp之间的有向豪斯多夫距离[62]可以定义为每个点x∈τa与其最近邻居y∈τp

其中||*||是欧几里得距离函数。由于~H(τa,τp)6=~H(σp,τa),豪斯多夫距离也被定义为两个方向上有向豪斯多夫距离的最大值,即。

Frechet距离:Fréchet距离[63,64]测量两条曲线之间的相似性。它被定义为两条曲线上对应点之间的最大距离在两条曲线的所有可能对齐上的最小值。

其中,两条2D多边形曲线τa和τp之间的Fréchet距离F(τa,τp)是τa(αt)和τp(βt)之间所有欧几里得距离的最大值的所有α,β的下确界(最大下界)。这里,t∈[0,1]表示当我们计算两个曲线点之间的距离时的时间实例。为了解决O(n2-log(n2))的计算复杂度,在[65]中提出了离散Frèchet距离,其计算复杂度为O(n2)。离散Frèchet距离经常被用作图像配准、对象识别和计算几何中的相似性度量。

2.5损失函数

损失函数是用于在训练期间优化模型的机器学习模型中的误差或损失的度量。在深度学习和计算机视觉中,目标通常是最小化成本函数,以提高模型在给定任务上的性能。根据具体任务和数据特征,有许多不同的成本函数可用于深度学习和计算机视觉。下面介绍了一些最常见的成本函数。

相关推荐
丰锋ff8 分钟前
考研英一学习笔记
笔记·学习·考研
睿创咨询13 分钟前
科技与商业动态简报
人工智能·科技·ipd·商业
科技在线13 分钟前
科技赋能建筑新未来:中建海龙模块化建筑产品入选中国建筑首批产业化推广产品
大数据·人工智能
hnlucky23 分钟前
redis 数据类型新手练习系列——Hash类型
数据库·redis·学习·哈希算法
HED24 分钟前
用扣子快速手撸人生中第一个AI智能应用!
前端·人工智能
极小狐26 分钟前
极狐GitLab 如何 cherry-pick 变更?
人工智能·git·机器学习·gitlab
沛沛老爹30 分钟前
从线性到非线性:简单聊聊神经网络的常见三大激活函数
人工智能·深度学习·神经网络·激活函数·relu·sigmoid·tanh
Invinciblenuonuo31 分钟前
FreeRTOS学习笔记【10】-----任务上下文切换
笔记·学习
好奇龙猫33 分钟前
日语学习-日语知识点小记-构建基础-JLPT-N4阶段(11): てあります。
学习
0x21139 分钟前
[论文阅读]ReAct: Synergizing Reasoning and Acting in Language Models
人工智能·语言模型·自然语言处理