如何从 minhash LSH 获得相似度矩阵?
How can I get the similarity matrix from minhash LSH?
我看了很多教程,也试了很多minhash LSH,但是都不能生成相似度矩阵,而是returns只是超过阈值的相似数据。我怎样才能生成它?我的意图是使用 LSH 结果进行聚类。
LSH 的重点是避免 成对距离,因为那不会缩放。
如果您随后将数据放入距离矩阵,则会再次遇到所有可伸缩性问题!
而是考虑像 DBSCAN 聚类这样的算法。它不需要距离矩阵,只需要距离为 epsilon 的邻居。
我看了很多教程,也试了很多minhash LSH,但是都不能生成相似度矩阵,而是returns只是超过阈值的相似数据。我怎样才能生成它?我的意图是使用 LSH 结果进行聚类。
LSH 的重点是避免 成对距离,因为那不会缩放。
如果您随后将数据放入距离矩阵,则会再次遇到所有可伸缩性问题!
而是考虑像 DBSCAN 聚类这样的算法。它不需要距离矩阵,只需要距离为 epsilon 的邻居。