如何使用 EM 算法确定 DBSCAN 在一个数据集上的参数(eps,minpts)?

How to use EM algorithms to determine parameters(eps,minpts) of DBSCAN over one dataset?

最近我选择对 public 数据集使用 DBSCAN 聚类。但是参数 Eps 和 minpts 非常敏感,很难在整个数据集上获得具有良好性能的良好参数值。调整DBSCAN的参数时似乎出现了过拟合。我知道 EM 算法可用于调整 GMM 的参数 models.I 想知道是否可以将 EM 算法用于 DBSCAN。我需要一些想法或建议。有人试过吗?

具有高斯混合模型的 EM 算法运行良好,因为 GMM 是概率模型。它为每个点生成一个概率,并且您知道如何推断模型参数以最大化概率。

我认为您不能有意义地将其应用于标记 DBSCAN。此连接模型中没有 "probability"。连接是一个二进制 属性,如果你试图最大化它,它只会让所有东西都连接起来,即epsilon = inifnity.