python 3 中的 LSH 实现具有欧氏距离并查看 LSHForest 中的所有邻居

LSH implementation in python 3 with Euclidean distance and seeing all neighbors in LSHForest

我正在寻找 python 3 中使用 Euclidean 距离的 LSH 的有效实现。

有 "in-python" LSHForest 实现,但它使用余弦距离。

此外,即使使用此实现,我也没有找到查看每个篮子内容的方法,例如,如果使用 LSH 进行聚类 - 它仅 returns 一定数量的近似邻居在一定半径内。但是如果我想看到所有的邻居,我不知道该怎么做(我不想使用任意搜索半径而且我真的不确定使用这个非常大或无限半径的含义是什么执行)。

将不胜感激任何见解。非常感谢。

有关软件推荐,请在此处询问:Software Recommendations


关于它是如何工作的,首先阅读我的 然后假设你从包裹中询问(我没有使用它)一个大的 k (k 应该是 Neighbors 的数量该软件 returns),在大半径 r 内。那应该 return 许多邻居,设置 k = N,其中 N 是数据集中的点数,您将获得所有邻居。

如果您想查看某个桶内的所有邻居,则必须调查一个桶可以包含多少个点并将 k 设置为该数字。