如何导出集群属性

How to derive cluster properties

我已经将 ~40000 个点聚类到 79 个簇中。每个点都是一个包含 18 个特征的向量。我想 'derive' 每个簇的特征 - 突出 features/characteristics 的簇。是否有机器学习算法可以得出这个?

如果您确信集群对您的特定需求有意义,您可以将其视为分类问题。

一种选择是应用特征选择算法对特征进行排名。您可以使用递归特征消除来识别可预测聚类标签的特征子集。

另一个解释集群的好方法是构建决策树。使用决策树,您可以看到哪些功能用于最好地分离 类 (在您的情况下为集群)。您还可以使用像随机森林这样的集成并询问特征重要性分数。