如何从 kNeighborsClassifier 中找到前 n 个匹配项?

How to find top n matches from kNeighborsClassifier?

我正在尝试从一组样本向量中搜索一个向量,每个向量都有一个标签。我需要找到最好的 n 匹配项。我为此使用 kNeighborsClassifier

nbrs = KNeighborsClassifier(n_neighbors=2, algorithm='ball_tree', metric='euclidean').fit(train_data_array, train_label)
yp = nbrs.predict(xt)

但问题是它 returns 只有前 1 个结果。我认为根据欧几里得距离,我可以得到顶部 n 匹配项,但我不确定如何提取该信息。

有一个 kneighbors() method in KNeighborsClassifier 可以使用。

它将 return 训练数据的索引(您在 fit() 中使用),以及最接近您在其中提供的点的距离。

示例:

from sklearn import datasets
from sklearn.neighbors import KNeighborsClassifier
iris = datasets.load_iris()
X = iris.data
y = iris.target

clf = KNeighborsClassifier()
clf.fit(X, y)

# here I am taking a single point only
distances, indices = clf.kneighbors(X[[0]],  n_neighbors=2)

print(distances, indices)

#Output: array([[0., 0.]]), array([[17,  0]])

这里第一个输出是距离,第二个是 X 的索引,最接近 X[[0]]