聚类 k-means 不是球形的

clustering k-means are not spherical

我是数据科学的初学者,我需要你的帮助 我正在尝试使用 K-means 测试无监督机器学习 但我发现结果不是球形的。我标准化了,我删除了异常值等。 我试图找到几种方法来纠正它,但它不起作用

图片如下: (我拿了一个数据集的小样本给你看,它实际上是 8000 行)

...

您的数据有 6 个维度。您无法以直接的方式可视化二维以上的数据,您需要使用 PCA 或 TSNE 来可视化它们。

from sklearn.decomposition import PCA
from sklearn.preprocessing import StandardScaler

pca = PCA(n_components=2)

principalComponents = pca.fit_transform(df)

principalDf = pd.DataFrame(data = principalComponents, columns = ['principal component 1', 'principal component 2'])

principalDf.head(5)

我使用 PCA6 尺寸减少到 2 : 它完美地分离了数据

输出: