分支因子 > 2 的层次聚类?

Hierarchical Clustering with branching factor > 2?

我在Python(scipy、scikit-learn 等)中看到的所有层次聚类方法一次拆分或组合两个集群。这迫使每个节点的分支因子为 2。出于我的目的,我希望模型允许分支因子大于 2。这在集群之间存在联系的情况下很有用。

我不熟悉任何分支因子大于 2 的层次聚类技术;它们存在吗?

将此数据集与单个 link 聚类:

0 0
0 1
1 0
1 1

并且您看到 4 向合并。

但对于其他 link 年龄段的人来说,始终找到 最佳 3 路拆分可能会将运行时间成本增加到 O(n^4)。你真的不想要那个。