Python K 均值 Z 变换
Python K-Means Z-Transform
我想使用 k-means 对我的结果进行聚类,但我有很多问题。
http://scikit-learn.org/stable/modules/generated/sklearn.cluster.KMeans.html#sklearn.cluster.KMeans
我的输入数据是这样的:
ID ABC XYZ UVW MSE
10 A X U 102000
12 B Y V 9000
是否可以使用 K-Means 对不同类型的输入数据进行聚类?就像我的情况一样,字符和数字?
K-means 为聚类过程选择一个随机中心。如果我 运行 聚类通常会改变我的结果还是输出稳定的结果?
我想知道,哪个ID在哪个集群。我如何从软件中获取这些信息?
编辑:
如果我只对我的 MSE 进行集群,然后我检查哪些属性受到影响,这个解决方案是否有意义?
K-means 尝试 最小化方差(=平方误差).
abc
和 def
的平方误差是多少?
仅用于连续数据。并且不要指望它会变魔术,您得到的通常只是您要寻找的东西的非常糟糕的近似值。 运行 它多次通常会给你不同的结果,因为不存在 'good' 个结果。
我想使用 k-means 对我的结果进行聚类,但我有很多问题。 http://scikit-learn.org/stable/modules/generated/sklearn.cluster.KMeans.html#sklearn.cluster.KMeans
我的输入数据是这样的:
ID ABC XYZ UVW MSE
10 A X U 102000
12 B Y V 9000
是否可以使用 K-Means 对不同类型的输入数据进行聚类?就像我的情况一样,字符和数字?
K-means 为聚类过程选择一个随机中心。如果我 运行 聚类通常会改变我的结果还是输出稳定的结果?
我想知道,哪个ID在哪个集群。我如何从软件中获取这些信息?
编辑:
如果我只对我的 MSE 进行集群,然后我检查哪些属性受到影响,这个解决方案是否有意义?
K-means 尝试 最小化方差(=平方误差).
abc
和 def
的平方误差是多少?
仅用于连续数据。并且不要指望它会变魔术,您得到的通常只是您要寻找的东西的非常糟糕的近似值。 运行 它多次通常会给你不同的结果,因为不存在 'good' 个结果。