K-Means 中具有相同值的多个对象

Multiple Object With Same Value in K-Means

我的数据有问题

这是我的医疗保健数据库

(名称、值 1、值 2、值 3、值 4)

约翰 10、20、30、40

约翰 9、12、21、33

挪亚 8、22、18、10

安娜 9、19、29、32

克拉克 11、4、17、20

在医疗保健数据库中,一个人可能会生病两次、三次或更多次,如您所见,我的数据库示例中有两个 jhon 有两条记录,因为他生病了两次

我使用 k-means 的目的是获得两个集群(集群 1:组 1,集群 2:组 2)及其成员

我想要这样的输出:

第 1 组:jhon、克拉克

第 2 组:诺亚、安娜、乔恩

你看有两个 jhon,一个成员可以分到第 1 组和第 2 组,那么我该如何解决这个问题呢??

K-means 通过步骤对之间的迭代来工作。你基本上在

之间交替
  1. 假设你知道实例到集群的映射,并计算集群中心

  2. 假设您知道聚类中心,将实例分配给聚类

因此,如果您有约束条件,例如,所有 jhon (sic) 应该属于同一个集群,您可以将其合并到步骤 2 中:您需要找到同时分配所有他们是最有可能的。

详情见Constrained k-means clustering with background