使用欧氏距离的 Numpy 数组的邻接矩阵

Question

有人可以帮助我了解如何根据所有行之间的欧氏距离从 numpy 数组生成加权邻接矩阵，即 0 和 1、0 和 2、.. 1 和 2，...？

给定以下输入矩阵 (5, 4) 的示例：

matrix = [[2,10,9,6],
          [5,1,4,7],
          [3,2,1,0], 
          [10, 20, 1, 4], 
          [17, 3, 5, 18]]

我想获得一个包含节点之间最小距离的加权邻接矩阵 (5,5)，即

if dist(row0, row1)= 10,77 and dist(row0, row2)= 12,84, 

--> the output matrix will take the first distance as a column value.

我已经用下面的代码解决了生成邻接矩阵的第一部分：

from scipy.spatial.distance import cdist
dist = cdist( matrix, matrix, metric='euclidean')

我得到以下结果：

array([[ 0.        , 10.77032961, 12.84523258, 15.23154621, 20.83266666],
       [10.77032961,  0.        ,  7.93725393, 20.09975124, 16.43167673],
       [12.84523258,  7.93725393,  0.        , 19.72308292, 23.17326045],
       [15.23154621, 20.09975124, 19.72308292,  0.        , 23.4520788 ],
       [20.83266666, 16.43167673, 23.17326045, 23.4520788 ,  0.        ]])

但我还不知道如何指定我们 select 的邻居数量，例如每个节点 2 个邻居。例如，我们定义邻居的数量 N = 2，然后对于每一行，我们只选择具有两个最小距离的两个邻居，结果是：

[[ 0.        , 10.77032961, 12.84523258, 0, 0],
       [10.77032961,  0.        ,  7.93725393, 0, 0],
       [12.84523258,  7.93725393,  0.        , 0, 0],
       [15.23154621, 0, 19.72308292,  0.        , 0 ],
       [20.83266666, 16.43167673, 0, 0 ,  0.        ]]

Answer 1

假设 a 是您的欧氏距离矩阵，您可以使用 np.argpartition 选择每行 n min/max 个值。请记住，对角线始终为 0 且欧氏距离为非负数，因此要在每行中保留两个最近点，您需要每行保留三个最小值（包括对角线上的 0）。但是，如果你想做最大，这不成立。

a[np.arange(a.shape[0])[:,None],np.argpartition(a, 3, axis=1)[:,3:]] = 0

输出：

array([[ 0.        , 10.77032961, 12.84523258,  0.        ,  0.        ],
       [10.77032961,  0.        ,  7.93725393,  0.        ,  0.        ],
       [12.84523258,  7.93725393,  0.        ,  0.        ,  0.        ],
       [15.23154621,  0.        , 19.72308292,  0.        ,  0.        ],
       [20.83266666, 16.43167673,  0.        ,  0.        ,  0.        ]])

Answer 2

您可以使用这个更简洁的解决方案从矩阵中获取最小的 n。尝试以下 -

dist.argsort(1).argsort(1) 在 axis=1 上创建了一个排名顺序（最小为 0，最大为 4），而 <= 2 决定了您需要从排名顺序中获得的 nsmallest 值的数量。 np.where 将其过滤或替换为 0。

np.where(dist.argsort(1).argsort(1) <= 2, dist, 0)

array([[ 0.        , 10.77032961, 12.84523258,  0.        ,  0.        ],
       [10.77032961,  0.        ,  7.93725393,  0.        ,  0.        ],
       [12.84523258,  7.93725393,  0.        ,  0.        ,  0.        ],
       [15.23154621,  0.        , 19.72308292,  0.        ,  0.        ],
       [20.83266666, 16.43167673,  0.        ,  0.        ,  0.        ]])

这适用于任何轴，或者如果您还想从矩阵中获取 nlargest 或 nsmallest。

使用欧氏距离的 Numpy 数组的邻接矩阵

Adjacency Matrix from Numpy array using Euclidean Distance

python

numpy

matrix

euclidean-distance

adjacency-matrix