机器学习中常用的几种距离——欧式、余弦等

目录

一、欧式距离(L2距离)

(1)二维空间的距离公式(三维空间的在这个基础上类推):

A(x1,y1),B(x2,y2)两点之间的欧式距离为:

(2)n维空间的距离公式

A(x1,x2,...,xn)和B(x21,x22,...,x2n)两点之间的欧式距离为:

二、曼哈顿距离(L1距离)

就是在欧几里得空间的固定直角坐标系上两点所形成的线段对轴产生的投射的距离总和。

如下图中,红线代表曼哈顿距离,绿色代表欧氏距离,也就是直线距离,而蓝色和黄色代表等价的

曼哈顿距离。

(1)二维空间的曼哈顿距离公式:

  • A(x1,y1),B(x2,y2)两点之间的曼哈顿距离为:
    dAB = |x1 - x2| + |y1 - y2|

(2)n维空间的曼哈顿距离公式:

  • A(x1,x2,...,xn)和B(x21,x22,...,x2n)两点之间的曼哈顿距离为:

三、汉明距离

编辑距离。两个等⻓ 字符串s1与s2的汉明距离为:将其中⼀个变为另外⼀个所需要作的最⼩字符替换次数。
【注意:】

编辑距离与汉明距离相比,编辑距离不要求两个字符串的长度等长,他追求的是如何以最少的编辑(替换,插入,删除,位置交换)次数让两个字符串相同。

四、余弦相似度

两个⼆维空间中向量A(x1,y1)与向量B(x2,y2)的夹⻆余弦公式:

两个n维样本点A(x1,x12,...,x1n)和B(x21,x22,...,x2n)的夹⻆余弦为:

优缺点及其他距离待续。。。。。。

相关推荐
Work(沉淀版)21 分钟前
DAY 40
人工智能·深度学习·机器学习
蓦然回首却已人去楼空1 小时前
Build a Large Language Model (From Scratch) 序章
人工智能·语言模型·自然语言处理
CM莫问1 小时前
<论文>(微软)WINA:用于加速大语言模型推理的权重感知神经元激活
人工智能·算法·语言模型·自然语言处理·大模型·推理加速
拾忆-eleven1 小时前
NLP学习路线图(二十六):自注意力机制
人工智能·深度学习
MYH5162 小时前
在NLP文本处理中,将字符映射到阿拉伯数字(构建词汇表vocab)的核心目的和意义
人工智能·深度学习·自然语言处理
要努力啊啊啊2 小时前
KV Cache:大语言模型推理加速的核心机制详解
人工智能·语言模型·自然语言处理
mzlogin4 小时前
DIY|Mac 搭建 ESP-IDF 开发环境及编译小智 AI
人工智能
归去_来兮5 小时前
知识图谱技术概述
大数据·人工智能·知识图谱
就是有点傻5 小时前
VM图像处理之图像二值化
图像处理·人工智能·计算机视觉
行云流水剑5 小时前
【学习记录】深入解析 AI 交互中的五大核心概念:Prompt、Agent、MCP、Function Calling 与 Tools
人工智能·学习·交互