使用 ELKI 进行增量集群

Incremental Clustering with ELKI

我使用 ELKI-Library 并使用 DBSCAN 实现了聚类,但是由于我使用的数据集随着时间的推移而增长,我想使用增量聚类算法。我发现这个 paper 关于增量 DBSCAN 算法。该论文说该算法是用 ELKI 实现的,并且该实现是对 ELKI 的贡献。 但不幸的是,我不知道如何逐步使用 DBSCAN。

我认为我们还没有收到对 ELKI 的贡献。

尝试联系作者。我们将不胜感激。

可以修改 ELKI 中的 GriDBSCAN 和 ParallelDBSCAN 实现以执行增量 DBSCAN 聚类,只要您只有插入,没有删除。

然而,构建一个好的增量 DBSCAN API 更难:应该何时以及如何报告 "results"?常规 DBSCAN 具有明确定义的结果,但增量 DBSCAN?中间数据是如何存储的?

如果您的数据集随着时间的推移不断增长,您可能也需要更改参数。例如,减少 epsilon 或增加 minpts。根据您的更新率,重新运行 DBSCAN 可能同样有效。