谱聚类与层次聚类
spectral clustering vs hierarchical clustering
任何人都可以解释一下使用层次聚类比谱聚类有什么优势吗?我知道它们是如何工作的,但我想知道在哪些情况下使用层次聚类比谱聚类更好。
层次聚类通常速度更快,并且生成一个很好的树状图供研究。
树状图对于了解是否具有良好的聚类非常有用。
此外,层次聚类非常灵活。您可以使用不同的距离函数和不同的链接策略。
谱聚类有一个有趣的理论;但要真正有效地工作,您的数据必须已经包含分离良好的 "connectedd components"。当你有非常嘈杂的数据时,祝你好运。
层次聚类:
- 这对分类数据很有用。
- 继续连接相似的点,直到你最终得到一个包含所有数据点的集群。
- 组合所有数据后得到的分组称为树状图。
- 根据您想要的聚类数量,您在一个级别切割树状图。
光谱聚类:
- 它适用于形状复杂的聚类数据,因为 K 均值和基于密度的聚类在这些情况下会失败。
- 将数据点视为图的顶点,将足够接近的顶点连接起来。因此,您还选择了一个 ε 值。所有比 ε 更近的顶点都是连通的。
- 与层次聚类不同,您不会得到完全连接的单个图(除非您采用高 ε 值并且没有非连接组件)。相反,您会得到多个连接的组件,每个组件代表一个集群。
任何人都可以解释一下使用层次聚类比谱聚类有什么优势吗?我知道它们是如何工作的,但我想知道在哪些情况下使用层次聚类比谱聚类更好。
层次聚类通常速度更快,并且生成一个很好的树状图供研究。
树状图对于了解是否具有良好的聚类非常有用。
此外,层次聚类非常灵活。您可以使用不同的距离函数和不同的链接策略。
谱聚类有一个有趣的理论;但要真正有效地工作,您的数据必须已经包含分离良好的 "connectedd components"。当你有非常嘈杂的数据时,祝你好运。
层次聚类:
- 这对分类数据很有用。
- 继续连接相似的点,直到你最终得到一个包含所有数据点的集群。
- 组合所有数据后得到的分组称为树状图。
- 根据您想要的聚类数量,您在一个级别切割树状图。
光谱聚类:
- 它适用于形状复杂的聚类数据,因为 K 均值和基于密度的聚类在这些情况下会失败。
- 将数据点视为图的顶点,将足够接近的顶点连接起来。因此,您还选择了一个 ε 值。所有比 ε 更近的顶点都是连通的。
- 与层次聚类不同,您不会得到完全连接的单个图(除非您采用高 ε 值并且没有非连接组件)。相反,您会得到多个连接的组件,每个组件代表一个集群。