聚类 k-means 不是球形的
clustering k-means are not spherical
我是数据科学的初学者,我需要你的帮助
我正在尝试使用 K-means 测试无监督机器学习
但我发现结果不是球形的。我标准化了,我删除了异常值等。
我试图找到几种方法来纠正它,但它不起作用
图片如下:
(我拿了一个数据集的小样本给你看,它实际上是 8000 行)
...
您的数据有 6 个维度。您无法以直接的方式可视化二维以上的数据,您需要使用 PCA 或 TSNE 来可视化它们。
from sklearn.decomposition import PCA
from sklearn.preprocessing import StandardScaler
pca = PCA(n_components=2)
principalComponents = pca.fit_transform(df)
principalDf = pd.DataFrame(data = principalComponents, columns = ['principal component 1', 'principal component 2'])
principalDf.head(5)
我使用 PCA
将 6
尺寸减少到 2
:
它完美地分离了数据
输出:
我是数据科学的初学者,我需要你的帮助 我正在尝试使用 K-means 测试无监督机器学习 但我发现结果不是球形的。我标准化了,我删除了异常值等。 我试图找到几种方法来纠正它,但它不起作用
图片如下: (我拿了一个数据集的小样本给你看,它实际上是 8000 行)
您的数据有 6 个维度。您无法以直接的方式可视化二维以上的数据,您需要使用 PCA 或 TSNE 来可视化它们。
from sklearn.decomposition import PCA
from sklearn.preprocessing import StandardScaler
pca = PCA(n_components=2)
principalComponents = pca.fit_transform(df)
principalDf = pd.DataFrame(data = principalComponents, columns = ['principal component 1', 'principal component 2'])
principalDf.head(5)
我使用 PCA
将 6
尺寸减少到 2
:
它完美地分离了数据
输出: