规则,在一个范围内支持
Arules, Support within a range
我是 运行 R 中使用 Arules 的 Aprori 算法。我有大量数据要挖掘,如果可能的话我不想使用样本。我真的只需要查看与不经常销售的商品相关的规则。
我现在使用的代码是:
basket_rules <-先验(数据,参数=列表(sup=0.7,conf=0.2,目标="rules",列表(minlen=4,maxlen=7))
我只想要支持度较低的规则,但由于我的数据的大小和性质,我无法获得低于 .7 的规则
是否可以 return a range of support 以节省内存。
例如:list(sup <=.05 and >=.0001)
任何其他限制内存使用的想法,同时 运行 Aprori 非常感谢。
支撑(向下闭合)的性质不允许您有效地仅生成 itemsets/rules 具有特定范围内的支撑。您始终必须先创建所有频繁项集,然后在 arules
中的 R 实现中进行过滤。可能有 FP-growth 或类似算法的实现,它们对您的问题具有更高的内存效率。
解决此问题的另一种方法是更仔细地查看数据。也许您有多个项目出现在许多交易中。您可能对这些项目不感兴趣,您可以在挖掘规则之前将其删除。
我是 运行 R 中使用 Arules 的 Aprori 算法。我有大量数据要挖掘,如果可能的话我不想使用样本。我真的只需要查看与不经常销售的商品相关的规则。
我现在使用的代码是:
basket_rules <-先验(数据,参数=列表(sup=0.7,conf=0.2,目标="rules",列表(minlen=4,maxlen=7))
我只想要支持度较低的规则,但由于我的数据的大小和性质,我无法获得低于 .7 的规则 是否可以 return a range of support 以节省内存。
例如:list(sup <=.05 and >=.0001)
任何其他限制内存使用的想法,同时 运行 Aprori 非常感谢。
支撑(向下闭合)的性质不允许您有效地仅生成 itemsets/rules 具有特定范围内的支撑。您始终必须先创建所有频繁项集,然后在 arules
中的 R 实现中进行过滤。可能有 FP-growth 或类似算法的实现,它们对您的问题具有更高的内存效率。
解决此问题的另一种方法是更仔细地查看数据。也许您有多个项目出现在许多交易中。您可能对这些项目不感兴趣,您可以在挖掘规则之前将其删除。