提供质心然后聚类

Providing Centroids and Then Clustering

我似乎找到了很多基于计算质心和聚类的文档,但是如果我自己分配质心值呢?

假设我提供 14 个不同的质心向量。我将如何将我的数据聚类到这 14 个不同的质心值?

也许这是一个简单的问题,但我还没有在网上找到答案,所以想确定一下。

不确定这属于 python 论坛,但您只需要计算每个点到每个质心的距离,然后将每个点分配给最近的质心。然后你就有了你的集群,尽管有些可能是空的(不能保证质心至少有一个最接近它的数据点)。您可以通过遍历所有点来完成此操作,或者使用带有 numpy 的矩阵一步更快地完成此操作。如果您需要一个示例来开始,我在某处提供了一些代码。

如果质心是预定义的,那么您正在进行最近邻分类,而不是聚类。如果结构是 预定义的,则它只是聚类。