谱聚类特征向量和特征值

spectral clustering eigenvectors and eigenvalues

谱聚类中的特征值和特征向量的物理含义是什么。我看到如果 λ_0 = λ_1 = 0 那么我们将有 2 个连接的组件。但是,λ_2,...,λ_k 告诉我们什么。我不明白多重性的代数连通性。

我们能否就图表的紧密性或与两个图表的比较得出任何结论?

特征值越小,连接越少。 0 仅表示 "disconnected".

将此视为您需要切割多少边以生成单独组件的值。切割与特征向量正交 - 假设有一些阈值 t,这样 t 以下的节点应该进入一个组件,t 以上的节点进入另一个组件。

这在某种程度上取决于算法。对于几种光谱算法,可以通过主成分分析轻松 运行 特征值,以降低显示维数以供人类消费。幂迭代聚类向量更难解释。

正如Mr.Roboto已经指出的那样,特征向量垂直于除法膜(高斯核变换后的平面)。谱聚类方法通常对密度不敏感("tightness" 是您的意思吗?)本身——它们会发现数据差距。例如,在形成第一个集群的单位球体内有 50 个或 500 个节点并不重要;改变游戏规则的是是否有清晰的 space(一个很好的间隙)而不是 "bread crumb" 点的细小轨迹(一系列微小的间隙)通向另一个集群。