FIR 树 KNDistancesSampler

ELKI KNNDistancesSampler

有人知道ELKI中的KNNDistancesSampler是怎么计算的吗?我可以看到函数的 java 代码:https://github.com/elki-project/elki/blob/master/elki/src/main/java/de/lmu/ifi/dbs/elki/algorithm/KNNDistancesSampler.java,但我在 java 方面真的很糟糕 - 我可以看到它应该通过 getKNNDistance() 获取其邻居的距离... 它是否返回每个点的 k 个最近邻居的平均距离(默认为欧几里得)?我知道它应该用于 dbscan etc.etc. 的 epsilon 估计,但我也想知道它在做什么...... 谢谢

class 文档中提供了相关参考资料:

Martin Ester, Hans-Peter Kriegel, Jörg Sander, Xiaowei Xu
A Density-Based Algorithm for Discovering Clusters in Large Spatial Databases with Noise
Proc. 2nd Int. Conf. on Knowledge Discovery and Data Mining (KDD '96)

Erich Schubert, Jörg Sander, Martin Ester, Hans-Peter Kriegel, Xiaowei Xu
DBSCAN Revisited, Revisited: Why and How You Should (Still) Use DBSCAN
ACM Trans. Database Systems (TODS)

class 正在返回 kNN 距离的样本,而不仅仅是平均值,以帮助在该图上使用“elbow”方法选择 epsilon 参数。它不会自动选择它 - 它只会产生情节。