如何在r中对簇的特征进行排序
how to rank the characteristic of cluster in r
这是通过k-means函数进行聚类分析的结果。
>weseg2<-read.csv("WE_SEG DATA.csv",header=TRUE)
>training.data2<-scale(weseg2)
>aaaa<-kmeans(training.data2, centers=4, iter.max=10000, nstart=20)
我想知道每个集群有什么特点。
所以我按集群得到了每个变量的平均值。
这是我计算变量平均值的代码。
第一个簇的平均值
>rank1<-colMeans(training.data2[aaaa$cluster==1,])
第二个簇的平均值
>rank2<-colMeans(training.data2[aaaa$cluster==2,])
第三个集群的平均值
>rank3<-colMeans(training.data2[aaaa$cluster==3,])
第四个集群的平均值
>rank4<-colMeans(training.data2[aaaa$cluster==4,])
如果是这样,应该输入什么代码才能对每个变量的集群进行排名?
例如,如果您有变量 a、b 和 c,则 a 变量中有四个聚类的秩,b 和 c 变量中有四个聚类的秩。
使用应用和排名功能。
像这样
>rank5<-cbind(rank1,rank2,rank3,rank4)
>apply(rank5,1,rank)
然后,您可以获得列的排名。
如果你想获得排名下降,请使用 order() 函数。
祝你好运。
这是通过k-means函数进行聚类分析的结果。
>weseg2<-read.csv("WE_SEG DATA.csv",header=TRUE)
>training.data2<-scale(weseg2)
>aaaa<-kmeans(training.data2, centers=4, iter.max=10000, nstart=20)
我想知道每个集群有什么特点。 所以我按集群得到了每个变量的平均值。 这是我计算变量平均值的代码。
第一个簇的平均值
>rank1<-colMeans(training.data2[aaaa$cluster==1,])
第二个簇的平均值
>rank2<-colMeans(training.data2[aaaa$cluster==2,])
第三个集群的平均值
>rank3<-colMeans(training.data2[aaaa$cluster==3,])
第四个集群的平均值
>rank4<-colMeans(training.data2[aaaa$cluster==4,])
如果是这样,应该输入什么代码才能对每个变量的集群进行排名? 例如,如果您有变量 a、b 和 c,则 a 变量中有四个聚类的秩,b 和 c 变量中有四个聚类的秩。
使用应用和排名功能。 像这样
>rank5<-cbind(rank1,rank2,rank3,rank4)
>apply(rank5,1,rank)
然后,您可以获得列的排名。 如果你想获得排名下降,请使用 order() 函数。
祝你好运。