如何聚类客户的偏好?

How to cluster preferences of customers?

简单地说,我有当年的销售数据集。我需要对用户偏好进行聚类。我为每个用户提供了这些销售量。例如, 我有购买 John 的矢量,它由 1 或零组成(是否购买)。

[1       ,0       ,0        ,1       ,0       ]
[product1,product2, product3,product4,product5]

这意味着约翰购买了产品1和产品4。可能有人看到了关于此的好文章。我需要聚类并为其他客户提供不同的东西,例如,如果一些客户有最近的邻居(距离足够小),那么我就可以从这个邻居那里给他提供东西。

提前,抱歉我的英语不好,谢谢

我对想法或文章感兴趣!

这些客户的真实矩阵大小为10^8*10^6

使用购物篮分析,而不是聚类分析。

特别是,它不假设每个客户都是典型的(集群的一部分)或者客户只能是一个客户的一部分。

同类规则

butter, bread -> marmelade

非常适合提供产品。