如何从 minhash LSH 获得相似度矩阵?

How can I get the similarity matrix from minhash LSH?

我看了很多教程,也试了很多minhash LSH,但是都不能生成相似度矩阵,而是returns只是超过阈值的相似数据。我怎样才能生成它?我的意图是使用 LSH 结果进行聚类。

LSH 的重点是避免 成对距离,因为那不会缩放。

如果您随后将数据放入距离矩阵,则会再次遇到所有可伸缩性问题!

而是考虑像 DBSCAN 聚类这样的算法。它不需要距离矩阵,只需要距离为 epsilon 的邻居。