在 MapReduce 中组合聚类算法

Combining clustering algorithms in MapReduce

对于我的大学项目,我最初想在 MapReduce 上实现一个组合聚类算法。我已经完成了 KMeans。现在我的问题是:

  1. 是否可以将任何其他聚类算法与 MapReduce 上的 Kmeans 结合使用?如果是,是什么算法,过程是什么?
  2. 如果无法合并,如何对现有 KMeans 进行增强?

您可以智能地应用一种方法 select 初始质心,而不是 select 随机设置它们。

有论文介绍了改进的K-Means算法。您可以参考其中的一个或多个并创建您自己的改进 K-Means 算法。