对 python 中的聚类分类数据执行多维缩放 (MDS)

Question

我目前正在对来自 Kaggle 的银行营销数据集的分类属性进行聚类。我用 kmodes 创建了三个集群：

输出：cluster_df

现在我想将簇的每一行可视化为投影或点，以便获得某种图像：

Desired visualization

我很难接受这个。我没有得到分类数据的欧氏距离，对吗？这是没有意义的。那么就没有可能创建这种所需的可视化了吗？

Answer 1

可视化集群的最佳方式是使用 PCA。您可以使用 PCA 将多维数据减少为二维，以便您可以绘制并希望更好地理解数据。要使用它，请参阅以下代码：

from sklearn.decomposition import PCA
pca = PCA(n_components=2)
principalComponents = pca.fit_transform(x)
principalDf = pd.DataFrame(data = principalComponents
             , columns = ['principal component 1', 'principal component 2'])

其中 x 是集群上经过拟合和转换的数据。现在您可以轻松地可视化您的聚类数据，因为它是二维的。

对 python 中的聚类分类数据执行多维缩放 (MDS)

Perform Multi-Dimension Scaling (MDS) for clustered categorical data in python

python

cluster-analysis

multi-dimensional-scaling

categorical-data