我应该使用哪种算法来分析所有商品之间的关系?
Which algorithm should I use to analyze the relation between all commodities?
所以现在我有很多不同人购买的商品清单。
1. bread, bear, egg, apple
2. carrot, water, glasses
3. apple, egg, bottle
4. meat, egg, soup, juice
5. water, carrot, bear
6. apple, carrot, water
....
我想知道哪种商品组合最受欢迎
我的示例的输出可能是这样的:
carrot, water
因为一起买更受其他商品组合的欢迎。
我知道该算法可能属于数据挖掘。
但是,我不知道关键字是什么。
我只要关键字(可能是算法名)我自己研究!
谢谢大家。 :)
您正在寻找名为
的子域
频繁项集挖掘
特别是 APRIORI 算法。
讲座常用项集
来自斯坦福的 CS246 课程可能对您有所帮助。
所以现在我有很多不同人购买的商品清单。
1. bread, bear, egg, apple
2. carrot, water, glasses
3. apple, egg, bottle
4. meat, egg, soup, juice
5. water, carrot, bear
6. apple, carrot, water
....
我想知道哪种商品组合最受欢迎
我的示例的输出可能是这样的:
carrot, water
因为一起买更受其他商品组合的欢迎。
我知道该算法可能属于数据挖掘。
但是,我不知道关键字是什么。
我只要关键字(可能是算法名)我自己研究!
谢谢大家。 :)
您正在寻找名为
的子域频繁项集挖掘
特别是 APRIORI 算法。
讲座常用项集 来自斯坦福的 CS246 课程可能对您有所帮助。