欧几里得距离(Euclidean Distance): 也称为L2范数,是最常见的距离度量方式。对于两个n维向量x和y,欧几里得距离表示为:[
d
(
x
,
y
)
=
∑
i
=
1
n
(
x
i
?
y
i
)
2
d(x, y) = \sqrt{\sum_{i=1}^{n}(x_i - y_i)^2}
d(x,y)=∑i=1n?(xi??yi?)2? ]
曼哈顿距离(Manhattan Distance): 也称为L1范数,表示为两点在各坐标轴上的距离总和。对于两个n维向量x和y,曼哈顿距离表示为:[
d
(
x
,
y
)
=
∑
i
=
1
n
∣
x
i
?
y
i
∣
d(x, y) = \sum_{i=1}^{n} |x_i - y_i|
d(x,y)=∑i=1n?∣xi??yi?∣]
切比雪夫距离(Chebyshev Distance): 也称为L∞范数,表示为两个向量在各个坐标轴上差值的最大值。对于两个n维向量x和y,切比雪夫距离表示为:[
d
(
x
,
y
)
=
max
?
i
(
∣
x
i
?
y
i
∣
)
d(x, y) = \max_{i}(|x_i - y_i|)
d(x,y)=maxi?(∣xi??yi?∣)]
余弦相似度(Cosine Similarity): 通过计算两个向量的夹角余弦值来度量它们的相似性,取值范围在[-1, 1]之间。余弦相似度定义为:[
similarity
(
x
,
y
)
=
x
?
y
∣
x
∣
?
∣
y
∣
\text{similarity}(x, y) = \frac{x \cdot y}{|x| \cdot |y|}
similarity(x,y)=∣x∣?∣y∣x?y? ]
马氏距离(Mahalanobis Distance): 考虑了各维度之间的协方差,对于协方差矩阵S,两个向量x和y的马氏距离表示为:[
d
M
(
x
,
y
)
=
(
x
?
y
)
T
S
?
1
(
x
?
y
)
d_M(x, y) = \sqrt{(x - y)^T S^{-1} (x - y)}
dM?(x,y)=(x?y)TS?1(x?y)? ]