对 python 中的聚类分类数据执行多维缩放 (MDS)
Perform Multi-Dimension Scaling (MDS) for clustered categorical data in python
我目前正在对来自 Kaggle 的银行营销数据集的分类属性进行聚类。我用 kmodes 创建了三个集群:
输出:cluster_df
现在我想将簇的每一行可视化为投影或点,以便获得某种图像:
Desired visualization
我很难接受这个。我没有得到分类数据的欧氏距离,对吗?这是没有意义的。那么就没有可能创建这种所需的可视化了吗?
可视化集群的最佳方式是使用 PCA。
您可以使用 PCA 将多维数据减少为二维,以便您可以绘制并希望更好地理解数据。
要使用它,请参阅以下代码:
from sklearn.decomposition import PCA
pca = PCA(n_components=2)
principalComponents = pca.fit_transform(x)
principalDf = pd.DataFrame(data = principalComponents
, columns = ['principal component 1', 'principal component 2'])
其中 x 是集群上经过拟合和转换的数据。
现在您可以轻松地可视化您的聚类数据,因为它是二维的。
我目前正在对来自 Kaggle 的银行营销数据集的分类属性进行聚类。我用 kmodes 创建了三个集群:
输出:cluster_df
现在我想将簇的每一行可视化为投影或点,以便获得某种图像:
Desired visualization
我很难接受这个。我没有得到分类数据的欧氏距离,对吗?这是没有意义的。那么就没有可能创建这种所需的可视化了吗?
可视化集群的最佳方式是使用 PCA。 您可以使用 PCA 将多维数据减少为二维,以便您可以绘制并希望更好地理解数据。 要使用它,请参阅以下代码:
from sklearn.decomposition import PCA
pca = PCA(n_components=2)
principalComponents = pca.fit_transform(x)
principalDf = pd.DataFrame(data = principalComponents
, columns = ['principal component 1', 'principal component 2'])
其中 x 是集群上经过拟合和转换的数据。 现在您可以轻松地可视化您的聚类数据,因为它是二维的。