找到凝聚方法的准确性?

Find Accuracy of an agglomeration method?

我使用最大聚集法绘制了树状图。

hc <- hclust(distance_matrix, method = "complete")
plot(hc, hang = 0, labels=ilpd_df$Class)

Q1) 如何判断这种团聚方法的准确性?

Q2) 如何评论测试数据对团聚方法的敏感性?

谢谢=)

聚类分析是探索性的,而不是预测性的。

准确度在预测时很有意义,但在探索数据时就不那么重要了。您将无法仅将此聚类方法应用于新数据点!

如果您确实有标记数据,最接近准确度的可能是兰德指数。这是预测一对点是否具有相同标签的准确性。