外部联动——出现平局时怎么办
External linkage - what to do when there is a tie
出于学习目的,我正在考虑从头开始实现一个完整的连锁聚类算法。我已经看到与单链接相比有很大的不同:
Unlike single linkage, the complete linkage method can be strongly affected by draw cases (where there are 2 groups/clusters with the same distance value in the distance matrix).
我想看一个发生这种情况的距离矩阵示例,并了解为什么会发生这种情况。
考虑一维数据集
1 2 3 4 5 6 7 8 9 10
根据第一次合并的方式,您可能会得到非常好的或非常糟糕的结果。比如先合并2-3、5-6和8-9。然后是 2-3-4 和 7-8-9。将此与大多数人会产生的 "obvious" 结果进行比较。
出于学习目的,我正在考虑从头开始实现一个完整的连锁聚类算法。我已经看到与单链接相比有很大的不同:
Unlike single linkage, the complete linkage method can be strongly affected by draw cases (where there are 2 groups/clusters with the same distance value in the distance matrix).
我想看一个发生这种情况的距离矩阵示例,并了解为什么会发生这种情况。
考虑一维数据集
1 2 3 4 5 6 7 8 9 10
根据第一次合并的方式,您可能会得到非常好的或非常糟糕的结果。比如先合并2-3、5-6和8-9。然后是 2-3-4 和 7-8-9。将此与大多数人会产生的 "obvious" 结果进行比较。