如何为凝聚层次聚类算法中的完整 link 方法绘制树状图
How to draw a Dendogram for complete link method in agglomerative hierarchical clustering algorithm
计算出每个元素之间的距离后,下一步应该如何创建完整 Link 方法的树状图?
假设我们有 6 个数据项 i1、i2、i3、i4、i5、i6,它们的距离应该如下图所示。
i1 i2 i3 i4 i5 i6
---------------------------------------------
i1 -
i2 d1.2 -
i3 d1.3 d2.3 -
i4 d1.4 d2.4 d3.4 -
i5 d1.5 d2.5 d3.5 d4.5 -
i6 d1.6 d2.6 d3.6 d5.6 d5.6 -
完全link表示最远的邻居。所以这应该在树状图中表达。树状图中垂直轴的最后一个值将是最长的距离。
先取距离最小的一对。如果有不止一对具有相同的距离值,就从您第一次遇到的那对开始。 [宁愿逐行并获得遇到的第一对]然后将树状图中的这两对与垂直轴中的距离值合并。 [绘制树状图时最好不要在开始时标记轴值。在整个过程中给它们贴上标签,这样你就可以避免线条重叠。]
那就去买下一双吧。如果这个新对影响树状图中已有的对,请检查那些与可以建立的对的距离是否具有比新对距离更高的值。如果是这样,请忽略新对并继续下一步。如果没有,您可以将它们合并到树状图中,并在垂直轴上使用该距离值。
例如:
- 最短距离为 d2.3。
- d2.3 < d3.4 < ............... < d2.4
所以 i2 和 i3 在树状图中合并在垂直轴 d2.3 的值处。
下一对 (i3,i4) 影响已经在树状图中的 i3,如果合并,它可以构建另一对 (i2,i4)。由于它的距离 d2.4 比 d3.4 高很多,这对新的 (i3,i4) 现在可以忽略不合并。
同样,您可以绘制树状图,描绘最远距离值处的最远邻居。
计算出每个元素之间的距离后,下一步应该如何创建完整 Link 方法的树状图?
假设我们有 6 个数据项 i1、i2、i3、i4、i5、i6,它们的距离应该如下图所示。
i1 i2 i3 i4 i5 i6
---------------------------------------------
i1 -
i2 d1.2 -
i3 d1.3 d2.3 -
i4 d1.4 d2.4 d3.4 -
i5 d1.5 d2.5 d3.5 d4.5 -
i6 d1.6 d2.6 d3.6 d5.6 d5.6 -
完全link表示最远的邻居。所以这应该在树状图中表达。树状图中垂直轴的最后一个值将是最长的距离。
先取距离最小的一对。如果有不止一对具有相同的距离值,就从您第一次遇到的那对开始。 [宁愿逐行并获得遇到的第一对]然后将树状图中的这两对与垂直轴中的距离值合并。 [绘制树状图时最好不要在开始时标记轴值。在整个过程中给它们贴上标签,这样你就可以避免线条重叠。]
那就去买下一双吧。如果这个新对影响树状图中已有的对,请检查那些与可以建立的对的距离是否具有比新对距离更高的值。如果是这样,请忽略新对并继续下一步。如果没有,您可以将它们合并到树状图中,并在垂直轴上使用该距离值。
例如:
- 最短距离为 d2.3。
- d2.3 < d3.4 < ............... < d2.4
所以 i2 和 i3 在树状图中合并在垂直轴 d2.3 的值处。 下一对 (i3,i4) 影响已经在树状图中的 i3,如果合并,它可以构建另一对 (i2,i4)。由于它的距离 d2.4 比 d3.4 高很多,这对新的 (i3,i4) 现在可以忽略不合并。
同样,您可以绘制树状图,描绘最远距离值处的最远邻居。