如何计算numpy数组的两行之间的欧氏距离
How to calculate euclidean distance between pair of rows of a numpy array
我有一个 numpy
数组,例如:
import numpy as np
a = np.array([[1,0,1,0],
[1,1,0,0],
[1,0,1,0],
[0,0,1,1]])
我想计算每对行之间的 euclidian distance
。
from scipy.spatial import distance
for i in range(0,a.shape[0]):
d = [np.sqrt(np.sum((a[i]-a[j])**2)) for j in range(i+1,a.shape[0])]
print(d)
[1.4142135623730951, 0.0, 1.4142135623730951]
[1.4142135623730951, 2.0]
[1.4142135623730951]
[]
因为我必须 运行 将这段代码放在一个巨大的 numpy
数组上,所以有没有更好的 pythonic 方法来做到这一点?
就更多 "elegant" 而言,您始终可以使用 scikitlearn 成对欧氏距离:
from sklearn.metrics.pairwise import euclidean_distances
euclidean_distances(a,a)
具有与单个数组相同的输出。
array([[ 0. , 1.41421356, 0. , 1.41421356],
[ 1.41421356, 0. , 1.41421356, 2. ],
[ 0. , 1.41421356, 0. , 1.41421356],
[ 1.41421356, 2. , 1.41421356, 0. ]])
我用了itertools.combinations
和差向量的np.linalg.norm
(这就是欧氏距离):
import numpy as np
import itertools
a = np.array([[1,0,1,0],
[1,1,0,0],
[1,0,1,0],
[0,0,1,1]])
print([np.linalg.norm(x[0]-x[1]) for x in itertools.combinations(a, 2)])
为了理解,请查看 docs 中的示例:
combinations('ABCD', 2)
给出 AB AC AD BC BD CD
。在您的例子中,A
、B
、C
和 D
是矩阵 a
的行,因此术语 x[0]-x[1]
出现在上面的代码是a
.
行中向量的差分向量
为了完整性,einsum 通常被引用用于距离计算。
a = np.array([[1,0,1,0],
[1,1,0,0],
[1,0,1,0],
[0,0,1,1]])
b = a.reshape(a.shape[0], 1, a.shape[1])
np.sqrt(np.einsum('ijk, ijk->ij', a-b, a-b))
array([[ 0. , 1.41421356, 0. , 1.41421356],
[ 1.41421356, 0. , 1.41421356, 2. ],
[ 0. , 1.41421356, 0. , 1.41421356],
[ 1.41421356, 2. , 1.41421356, 0. ]])
我有一个 numpy
数组,例如:
import numpy as np
a = np.array([[1,0,1,0],
[1,1,0,0],
[1,0,1,0],
[0,0,1,1]])
我想计算每对行之间的 euclidian distance
。
from scipy.spatial import distance
for i in range(0,a.shape[0]):
d = [np.sqrt(np.sum((a[i]-a[j])**2)) for j in range(i+1,a.shape[0])]
print(d)
[1.4142135623730951, 0.0, 1.4142135623730951]
[1.4142135623730951, 2.0]
[1.4142135623730951]
[]
因为我必须 运行 将这段代码放在一个巨大的 numpy
数组上,所以有没有更好的 pythonic 方法来做到这一点?
就更多 "elegant" 而言,您始终可以使用 scikitlearn 成对欧氏距离:
from sklearn.metrics.pairwise import euclidean_distances
euclidean_distances(a,a)
具有与单个数组相同的输出。
array([[ 0. , 1.41421356, 0. , 1.41421356],
[ 1.41421356, 0. , 1.41421356, 2. ],
[ 0. , 1.41421356, 0. , 1.41421356],
[ 1.41421356, 2. , 1.41421356, 0. ]])
我用了itertools.combinations
和差向量的np.linalg.norm
(这就是欧氏距离):
import numpy as np
import itertools
a = np.array([[1,0,1,0],
[1,1,0,0],
[1,0,1,0],
[0,0,1,1]])
print([np.linalg.norm(x[0]-x[1]) for x in itertools.combinations(a, 2)])
为了理解,请查看 docs 中的示例:
combinations('ABCD', 2)
给出 AB AC AD BC BD CD
。在您的例子中,A
、B
、C
和 D
是矩阵 a
的行,因此术语 x[0]-x[1]
出现在上面的代码是a
.
为了完整性,einsum 通常被引用用于距离计算。
a = np.array([[1,0,1,0],
[1,1,0,0],
[1,0,1,0],
[0,0,1,1]])
b = a.reshape(a.shape[0], 1, a.shape[1])
np.sqrt(np.einsum('ijk, ijk->ij', a-b, a-b))
array([[ 0. , 1.41421356, 0. , 1.41421356],
[ 1.41421356, 0. , 1.41421356, 2. ],
[ 0. , 1.41421356, 0. , 1.41421356],
[ 1.41421356, 2. , 1.41421356, 0. ]])