规则,在一个范围内支持

Arules, Support within a range

我是 运行 R 中使用 Arules 的 Aprori 算法。我有大量数据要挖掘,如果可能的话我不想使用样本。我真的只需要查看与不经常销售的商品相关的规则。

我现在使用的代码是:

basket_rules <-先验(数据,参数=列表(sup=0.7,conf=0.2,目标="rules",列表(minlen=4,maxlen=7))

我只想要支持度较低的规则,但由于我的数据的大小和性质,我无法获得低于 .7 的规则 是否可以 return a range of support 以节省内存。

例如:list(sup <=.05 and >=.0001)

任何其他限制内存使用的想法,同时 运行 Aprori 非常感谢。

支撑(向下闭合)的性质不允许您有效地仅生成 itemsets/rules 具有特定范围内的支撑。您始终必须先创建所有频繁项集,然后在 arules 中的 R 实现中进行过滤。可能有 FP-growth 或类似算法的实现,它们对您的问题具有更高的内存效率。

解决此问题的另一种方法是更仔细地查看数据。也许您有多个项目出现在许多交易中。您可能对这些项目不感兴趣,您可以在挖掘规则之前将其删除。