同一数据集的不同树

different tree for the same data set

我正在 Weka 的 Pima Indians Diabetes Database 上工作。我注意到对于决策树 J48,与随机树相比,树更小。 我无法理解为什么会这样? 谢谢。

虽然它们都是决策树,但它们使用不同的算法来构建树,这(很可能)会给你不同的结果:

  • J48 prunes the tree by default after it built its tree (Wikipedia).
  • RandomTree(使用默认参数时)检查最多 log2(num_attributes) 个属性以生成拆分。