计算两个 python 数组之间的欧氏距离
Calculate Euclidean distance between two python arrays
我想编写一个函数来计算 list_a
中的坐标与 list_b
中的每个坐标之间的欧氏距离,并生成维度为 a
行的距离数组按 b
列(其中 a
是 list_a
中的坐标数,b
是 list_b
中的坐标数。
注意:为了简单起见,我不想使用除 numpy 以外的任何库。
list_a = np.array([[0,1], [2,2], [5,4], [3,6], [4,2]])
list_b = np.array([[0,1],[5,4]])
运行 函数将生成:
>>> np.array([[0., 5.830951894845301],
[2.236, 3.605551275463989],
[5.830951894845301, 0.],
[5.830951894845301, 2.8284271247461903],
[4.123105625617661, 2.23606797749979]])
我一直在努力 运行 以下
def run_euc(list_a,list_b):
euc_1 = [np.subtract(list_a, list_b)]
euc_2 = sum(sum([i**2 for i in euc_1]))
return np.sqrt(euc_2)
但我收到以下错误:
ValueError: operands could not be broadcast together with shapes (5,2) (2,2)
谢谢。
在这里,您可以只使用np.linalg.norm
来计算欧氏距离。您的错误是由于 np.subtract 期望两个输入的长度相同。
import numpy as np
list_a = np.array([[0,1], [2,2], [5,4], [3,6], [4,2]])
list_b = np.array([[0,1],[5,4]])
def run_euc(list_a,list_b):
return np.array([[ np.linalg.norm(i-j) for j in list_b] for i in list_a])
print(run_euc(list_a, list_b))
代码产生:
[[0. 5.83095189]
[2.23606798 3.60555128]
[5.83095189 0. ]
[5.83095189 2.82842712]
[4.12310563 2.23606798]]
我希望这能回答问题,但这是重复的;
Minimum Euclidean distance between points in two different Numpy arrays, not within
# Import package
import numpy as np
# Define unequal matrices
xy1 = np.array([[0,1], [2,2], [5,4], [3,6], [4,2]])
xy2 = np.array([[0,1],[5,4]])
P = np.add.outer(np.sum(xy1**2, axis=1), np.sum(xy2**2, axis=1))
N = np.dot(xy1, xy2.T)
dists = np.sqrt(P - 2*N)
print(dists)
另一种方法是:
np.array(
[np.sqrt((list_a[:,1]-list_b[i,1])**2+(list_a[:,0]-list_b[i,0])**2) for i in range(len(list_b))]
).T
输出:
array([[0. , 5.83095189],
[2.23606798, 3.60555128],
[5.83095189, 0. ],
[5.83095189, 2.82842712],
[4.12310563, 2.23606798]])
这段代码可以用更简单高效的方式编写,所以如果您发现代码中有任何可以改进的地方,请在评论中告诉我。
我认为这可行
import numpy as np
def distance(x,y):
x=np.array(x)
y=np.array(y)
p=np.sum((x-y)**2)
d=np.sqrt(p)
return d
我想知道是什么阻止了您使用 Scipy。由于您无论如何都在使用 numpy,也许您可以尝试使用 Scipy,它不是那么重。
为什么?
它有许多数学函数和高效的实现,以充分利用您的计算能力。
考虑到这一点,这里有一个 distance_matrix 函数,完全符合您提到的目的。
具体来说,它采用 list_a(m x k 矩阵)和 list_b(n x k 矩阵)并输出每对点之间具有 p 范数(欧几里得 p=2)距离的 m x n 矩阵跨越两个矩阵。
from scipy.spatial import distance_matrix
distances = distance_matrix(list_a, list_b)
使用 scipy
,您可以按如下方式计算每对之间的距离:
import numpy as np
from scipy.spatial import distance
list_a = np.array([[0,1], [2,2], [5,4], [3,6], [4,2]])
list_b = np.array([[0,1],[5,4]])
dist = distance.cdist(list_a, list_b, 'euclidean')
print(dist)
结果:
array([[0. , 5.83095189],
[2.23606798, 3.60555128],
[5.83095189, 0. ],
[5.83095189, 2.82842712],
[4.12310563, 2.23606798]])
我想编写一个函数来计算 list_a
中的坐标与 list_b
中的每个坐标之间的欧氏距离,并生成维度为 a
行的距离数组按 b
列(其中 a
是 list_a
中的坐标数,b
是 list_b
中的坐标数。
注意:为了简单起见,我不想使用除 numpy 以外的任何库。
list_a = np.array([[0,1], [2,2], [5,4], [3,6], [4,2]])
list_b = np.array([[0,1],[5,4]])
运行 函数将生成:
>>> np.array([[0., 5.830951894845301],
[2.236, 3.605551275463989],
[5.830951894845301, 0.],
[5.830951894845301, 2.8284271247461903],
[4.123105625617661, 2.23606797749979]])
我一直在努力 运行 以下
def run_euc(list_a,list_b):
euc_1 = [np.subtract(list_a, list_b)]
euc_2 = sum(sum([i**2 for i in euc_1]))
return np.sqrt(euc_2)
但我收到以下错误:
ValueError: operands could not be broadcast together with shapes (5,2) (2,2)
谢谢。
在这里,您可以只使用np.linalg.norm
来计算欧氏距离。您的错误是由于 np.subtract 期望两个输入的长度相同。
import numpy as np
list_a = np.array([[0,1], [2,2], [5,4], [3,6], [4,2]])
list_b = np.array([[0,1],[5,4]])
def run_euc(list_a,list_b):
return np.array([[ np.linalg.norm(i-j) for j in list_b] for i in list_a])
print(run_euc(list_a, list_b))
代码产生:
[[0. 5.83095189]
[2.23606798 3.60555128]
[5.83095189 0. ]
[5.83095189 2.82842712]
[4.12310563 2.23606798]]
我希望这能回答问题,但这是重复的; Minimum Euclidean distance between points in two different Numpy arrays, not within
# Import package
import numpy as np
# Define unequal matrices
xy1 = np.array([[0,1], [2,2], [5,4], [3,6], [4,2]])
xy2 = np.array([[0,1],[5,4]])
P = np.add.outer(np.sum(xy1**2, axis=1), np.sum(xy2**2, axis=1))
N = np.dot(xy1, xy2.T)
dists = np.sqrt(P - 2*N)
print(dists)
另一种方法是:
np.array(
[np.sqrt((list_a[:,1]-list_b[i,1])**2+(list_a[:,0]-list_b[i,0])**2) for i in range(len(list_b))]
).T
输出:
array([[0. , 5.83095189],
[2.23606798, 3.60555128],
[5.83095189, 0. ],
[5.83095189, 2.82842712],
[4.12310563, 2.23606798]])
这段代码可以用更简单高效的方式编写,所以如果您发现代码中有任何可以改进的地方,请在评论中告诉我。
我认为这可行
import numpy as np
def distance(x,y):
x=np.array(x)
y=np.array(y)
p=np.sum((x-y)**2)
d=np.sqrt(p)
return d
我想知道是什么阻止了您使用 Scipy。由于您无论如何都在使用 numpy,也许您可以尝试使用 Scipy,它不是那么重。
为什么?
它有许多数学函数和高效的实现,以充分利用您的计算能力。
考虑到这一点,这里有一个 distance_matrix 函数,完全符合您提到的目的。
具体来说,它采用 list_a(m x k 矩阵)和 list_b(n x k 矩阵)并输出每对点之间具有 p 范数(欧几里得 p=2)距离的 m x n 矩阵跨越两个矩阵。
from scipy.spatial import distance_matrix
distances = distance_matrix(list_a, list_b)
使用 scipy
,您可以按如下方式计算每对之间的距离:
import numpy as np
from scipy.spatial import distance
list_a = np.array([[0,1], [2,2], [5,4], [3,6], [4,2]])
list_b = np.array([[0,1],[5,4]])
dist = distance.cdist(list_a, list_b, 'euclidean')
print(dist)
结果:
array([[0. , 5.83095189],
[2.23606798, 3.60555128],
[5.83095189, 0. ],
[5.83095189, 2.82842712],
[4.12310563, 2.23606798]])