同一数据集的不同树
different tree for the same data set
我正在 Weka 的 Pima Indians Diabetes Database 上工作。我注意到对于决策树 J48,与随机树相比,树更小。
我无法理解为什么会这样?
谢谢。
虽然它们都是决策树,但它们使用不同的算法来构建树,这(很可能)会给你不同的结果:
- J48 prunes the tree by default after it built its tree (Wikipedia).
- RandomTree(使用默认参数时)检查最多
log2(num_attributes)
个属性以生成拆分。
我正在 Weka 的 Pima Indians Diabetes Database 上工作。我注意到对于决策树 J48,与随机树相比,树更小。 我无法理解为什么会这样? 谢谢。
虽然它们都是决策树,但它们使用不同的算法来构建树,这(很可能)会给你不同的结果:
- J48 prunes the tree by default after it built its tree (Wikipedia).
- RandomTree(使用默认参数时)检查最多
log2(num_attributes)
个属性以生成拆分。