如何聚类客户的偏好？

Question

简单地说，我有当年的销售数据集。我需要对用户偏好进行聚类。我为每个用户提供了这些销售量。例如，我有购买 John 的矢量，它由 1 或零组成（是否购买）。

[1       ,0       ,0        ,1       ,0       ]
[product1,product2, product3,product4,product5]

这意味着约翰购买了产品1和产品4。可能有人看到了关于此的好文章。我需要聚类并为其他客户提供不同的东西，例如，如果一些客户有最近的邻居（距离足够小），那么我就可以从这个邻居那里给他提供东西。

提前，抱歉我的英语不好，谢谢

我对想法或文章感兴趣！

这些客户的真实矩阵大小为10^8*10^6

Answer 1

使用购物篮分析，而不是聚类分析。

特别是，它不假设每个客户都是典型的（集群的一部分）或者客户只能是一个客户的一部分。

How to cluster preferences of customers?