数据挖掘中有哪些不同的模式评估措施?
What are the different pattern evaluation measures in data mining?
在数据挖掘中,频繁项集是使用Apriori算法、FP-Tree等不同算法找到的。那么这些是模式评估方法吗?
您可以尝试关联规则(例如先验)、协同过滤(基于项目或基于用户)甚至聚类。
我不知道你想做什么,但如果你有一个数据集并且你需要找到最频繁的项目集,你应该尝试上面的一些技术。
如果您使用的是 R,则应该探索关联规则的 arules 包(例如)。
Apriori 算法和 FP-tree 算法用于查找给定事务数据的频繁项集。这将有助于购物篮分析应用程序。对于模式评估,有许多组件,即:
- 支持,
- 自信,
- 电梯,
- 失衡率等
更多细节可以看论文:
Selecting the right interestingness measure for association patterns by Pang Ning Tan, Vipin Kumar, Jaideep Srivastava, KDD 2002.
在数据挖掘中,频繁项集是使用Apriori算法、FP-Tree等不同算法找到的。那么这些是模式评估方法吗?
您可以尝试关联规则(例如先验)、协同过滤(基于项目或基于用户)甚至聚类。
我不知道你想做什么,但如果你有一个数据集并且你需要找到最频繁的项目集,你应该尝试上面的一些技术。
如果您使用的是 R,则应该探索关联规则的 arules 包(例如)。
Apriori 算法和 FP-tree 算法用于查找给定事务数据的频繁项集。这将有助于购物篮分析应用程序。对于模式评估,有许多组件,即:
- 支持,
- 自信,
- 电梯,
- 失衡率等
更多细节可以看论文:
Selecting the right interestingness measure for association patterns by Pang Ning Tan, Vipin Kumar, Jaideep Srivastava, KDD 2002.