凝聚聚类和分裂聚类最终能得到相同的结果吗?

Can agglomerative clustering and divisive clustering get the same result in the end?

现在,我知道凝聚是自下而上的方法,而分裂是自上而下的方法。但是,我不知道它们在具体过程中有什么不同。例如,它们是否都使用邻近矩阵来计算样本之间的任何成对距离?此外,如果我设置所有相同的参数,如相同的链接标准、相同的目标集群数量……它们最终会得到完全相同的结果吗?

凝聚聚类和分裂聚类是聚类范式,而不是特定的算法。一般来说,不同的算法会 return 不同的树状图,但不一定。这里有两个 return 相同的树状图(假设所有距离都不同):

  1. 凝聚聚类:重复加入属于不同簇的最近点对的两个簇。

  2. Divisive clustering: 重复拆分每个集群,以最大化属于拆分不同边的最近的一对点之间的距离。

事实证明,这两种聚类算法都产生了最小生成树。