Rapidminer 决策树结果
Rapidminer Decision Tree results
抱歉,我是 rapidminer 的新手,对我的决策树的结果有点困惑。我增加了最小叶子尺寸,这导致了一个更小、更易读的决策树,但是我的准确性结果损失了 2%。我被要求解释原因,但我不知道一棵更好的树但不太准确的数据对我的数据有何影响。
非常感谢任何帮助我们。
尼尔。
增加最小叶子大小可以防止非常特殊的叶子,只有 "match" 很少的例子。这样做通常是为了防止过度拟合,极端形式只是以 100% 的准确度重现训练数据。尽管如此,您仍希望使模型在真实的新数据上更加稳健。因此,根据您估计准确度的方式,您预计在强制算法创建更通用的模型时准确度会有所下降。
此外,在谈论 "more readable" 树时,不要试图单独解释节点。不要假设根节点中的属性是最重要的。它始终是您通往叶子的属性组合。
抱歉,我是 rapidminer 的新手,对我的决策树的结果有点困惑。我增加了最小叶子尺寸,这导致了一个更小、更易读的决策树,但是我的准确性结果损失了 2%。我被要求解释原因,但我不知道一棵更好的树但不太准确的数据对我的数据有何影响。
非常感谢任何帮助我们。
尼尔。
增加最小叶子大小可以防止非常特殊的叶子,只有 "match" 很少的例子。这样做通常是为了防止过度拟合,极端形式只是以 100% 的准确度重现训练数据。尽管如此,您仍希望使模型在真实的新数据上更加稳健。因此,根据您估计准确度的方式,您预计在强制算法创建更通用的模型时准确度会有所下降。
此外,在谈论 "more readable" 树时,不要试图单独解释节点。不要假设根节点中的属性是最重要的。它始终是您通往叶子的属性组合。