使用 KMeans 时为每个质心获取 2 个以上的坐标
Getting more than 2 co-ordinates for each Centroids while using KMeans
我是机器学习的新手,我正在使用
from sklearn import datasets
iris=datasets.load_iris()
了解 KMeans。所以我使用数据来适应使用像这样的 KMeans
kmeans=KMeans(n_clusters=1,random_state=42).fit(iris['data'])
print(kmeans.cluster_centers_)
我看到的是,我得到 4 个坐标而不是 2 个
[[5.84333333 3.05733333 3.758 1.19933333]]
我通过这个 article 了解了 KMeans,但这篇文章也用两个坐标进行了演示
问题
为什么我得到 4 个坐标而不是 2 个,我做错了什么以及我缺少什么
鸢尾花数据集包含 4 个特征,描述了三种不同类型的花(即 3 类)。因此,数据集中的每个点都位于 4 维 space 中,这同样适用于质心,因此要描述它们的位置,您需要 4 个坐标。
在示例中,使用 2 维数据(有时是 3 维)更容易,因为它更容易绘制和显示以用于教学目的,但质心的坐标将与数据的维度一样多(即特征),因此对于 Iris 数据集,您会期望 4 个坐标。
我是机器学习的新手,我正在使用
from sklearn import datasets
iris=datasets.load_iris()
了解 KMeans。所以我使用数据来适应使用像这样的 KMeans
kmeans=KMeans(n_clusters=1,random_state=42).fit(iris['data'])
print(kmeans.cluster_centers_)
我看到的是,我得到 4 个坐标而不是 2 个
[[5.84333333 3.05733333 3.758 1.19933333]]
我通过这个 article 了解了 KMeans,但这篇文章也用两个坐标进行了演示
问题
为什么我得到 4 个坐标而不是 2 个,我做错了什么以及我缺少什么
鸢尾花数据集包含 4 个特征,描述了三种不同类型的花(即 3 类)。因此,数据集中的每个点都位于 4 维 space 中,这同样适用于质心,因此要描述它们的位置,您需要 4 个坐标。
在示例中,使用 2 维数据(有时是 3 维)更容易,因为它更容易绘制和显示以用于教学目的,但质心的坐标将与数据的维度一样多(即特征),因此对于 Iris 数据集,您会期望 4 个坐标。