如何为凝聚层次聚类算法中的完整 link 方法绘制树状图

How to draw a Dendogram for complete link method in agglomerative hierarchical clustering algorithm

计算出每个元素之间的距离后,下一步应该如何创建完整 Link 方法的树状图?

假设我们有 6 个数据项 i1、i2、i3、i4、i5、i6,它们的距离应该如下图所示。

      i1     i2     i3     i4     i5     i6
---------------------------------------------
i1     -
i2   d1.2     -
i3   d1.3   d2.3     -
i4   d1.4   d2.4   d3.4     -
i5   d1.5   d2.5   d3.5   d4.5     -
i6   d1.6   d2.6   d3.6   d5.6   d5.6    -

完全link表示最远的邻居。所以这应该在树状图中表达。树状图中垂直轴的最后一个值将是最长的距离。

先取距离最小的一对。如果有不止一对具有相同的距离值,就从您第一次遇到的那对开始。 [宁愿逐行并获得遇到的第一对]然后将树状图中的这两对与垂直轴中的距离值合并。 [绘制树状图时最好不要在开始时标记轴值。在整个过程中给它们贴上标签,这样你就可以避免线条重叠。]

那就去买下一双吧。如果这个新对影响树状图中已有的对,请检查那些与可以建立的对的距离是否具有比新对距离更高的值。如果是这样,请忽略新对并继续下一步。如果没有,您可以将它们合并到树状图中,并在垂直轴上使用该距离值。

例如:

  • 最短距离为 d2.3。
  • d2.3 < d3.4 < ............... < d2.4

所以 i2 和 i3 在树状图中合并在垂直轴 d2.3 的值处。 下一对 (i3,i4) 影响已经在树状图中的 i3,如果合并,它可以构建另一对 (i2,i4)。由于它的距离 d2.4 比 d3.4 高很多,这对新的 (i3,i4) 现在可以忽略不合并。

同样,您可以绘制树状图,描绘最远距离值处的最远邻居。