数据挖掘中有哪些不同的模式评估措施?

What are the different pattern evaluation measures in data mining?

在数据挖掘中,频繁项集是使用Apriori算法、FP-Tree等不同算法找到的。那么这些是模式评估方法吗?

您可以尝试关联规则(例如先验)、协同过滤(基于项目或基于用户)甚至聚类。

我不知道你想做什么,但如果你有一个数据集并且你需要找到最频繁的项目集,你应该尝试上面的一些技术。

如果您使用的是 R,则应该探索关联规则的 arules 包(例如)。

Apriori 算法和 FP-tree 算法用于查找给定事务数据的频繁项集。这将有助于购物篮分析应用程序。对于模式评估,有许多组件,即:

  1. 支持,
  2. 自信,
  3. 电梯,
  4. 失衡率等

更多细节可以看论文:

Selecting the right interestingness measure for association patterns by Pang Ning Tan, Vipin Kumar, Jaideep Srivastava, KDD 2002.