R - 在聚类分析中识别 "Prime Examples"

Question

我执行了聚类分析，结果我得到了 4 个不同的聚类。使用 $kcmem 我可以看到哪个站属于哪个集群。但我想从每个 Cluster 中挑选出一个 Station 并进一步分析它。

我得到了这个结果（这只是一个测试，我有 6 个以上的站）。我选了4个集群。

$kcmem
     4 5
[1,] 1 1
[2,] 2 2
[3,] 3 3
[4,] 3 3
[5,] 4 4
[6,] 4 5

当然我想为每个Cluster选择最典型的Station。我怎么做？从主成分分析我知道实际上有一个加载列表，你可以看到一个站与一个组有多少相关。

我只能认为$kccentroids？但是同一集群中的所有站点都具有相同的值。

$kccentroids
     [,1]      [,2]      [,3]      [,4]      [,5]      [,6]
4 1.0000000 0.5043308 0.7270394 0.7269328 0.6742015 0.6782120
4 0.5043308 1.0000000 0.5465914 0.5685687 0.6443715 0.5181649
4 0.7269861 0.5575801 0.9541015 0.9541015 0.8253911 0.8108125
4 0.6762068 0.5812682 0.7937889 0.8424147 0.9630949 0.9630949

有人能帮忙吗？我需要一个命令来显示为什么一个站属于某个集群，这样我就可以挑选出每个集群的 1 个站作为 "prime example"。

Answer 1

选择离集群质心最近的站点。

这将是 KMeans 的常用方法。

如果您使用 PAM (k medoids) 或亲和传播或极小极大等算法，那么这些方法自然会提供聚类代表。

R - 在聚类分析中识别 "Prime Examples"

R - Identify "Prime Examples" in Cluster Analysis

r

cluster-analysis

hierarchical-clustering