决策树如何可能不稳定?
How are decision trees potentially unstable?
我正在阅读 "Decision Trees for Analytics Using SAS Enterprise Miner" 并且有一篇文章指出决策树可能不稳定,但没有解释原因。他们怎么不稳定?
如果数据中的微小变化可能导致生成完全不同的树,则决策树可能会不稳定。您可以使用各种集成方法来解决这个问题,例如装袋、提升或堆叠。
scikit-learn 网站上关于决策树的图片也可能有助于您的直觉:
http://scikit-learn.org/stable/modules/tree.html
它只是表明决策树中的过度拟合会导致剧烈的结果。
我正在阅读 "Decision Trees for Analytics Using SAS Enterprise Miner" 并且有一篇文章指出决策树可能不稳定,但没有解释原因。他们怎么不稳定?
如果数据中的微小变化可能导致生成完全不同的树,则决策树可能会不稳定。您可以使用各种集成方法来解决这个问题,例如装袋、提升或堆叠。
scikit-learn 网站上关于决策树的图片也可能有助于您的直觉: http://scikit-learn.org/stable/modules/tree.html
它只是表明决策树中的过度拟合会导致剧烈的结果。