基于分布的弱学习者：决策树桩

weak Learners based on distributions : Decision stump

我需要提升决策树桩弱 classifier。因此，对于每次迭代，我都必须根据某些权重来训练弱 classifier。然后我将在每次迭代后更新权重。到目前为止我已经明白了。但我不清楚的部分是 "Train decision stump weak classifier based on weights" 。他们究竟是怎么做到的？谁能通俗地解释一下？

假设我有训练数据集{(x1,y1),(x2,y2).......,(xm,ym)} X 是特征（比如 10），y 是二进制 class

最初权重是 w(x) = 1/m

因此决策树桩弱学习器应该根据权重给出 h(x)，它应该是二进制的。

该算法是如何工作的？决策树桩将采用哪些特征？

对于提升任务，您需要在算法的每次迭代中选择最佳 classifier。为此，您需要最小化数据集上树桩相对于权重的平均误差，因此您必须在计算 classifier 的误差度量时考虑对象的权重。因此，classifier 对大权重对象的错误标记的惩罚将大于对小权重对象的错误标记的惩罚。

你可以看我的implementation在R语言上对决策树的提升，效果很好，对于决策树桩，只需将第132行的树深度改为1，你可以用不同的数字测试准确率class 的 ifiers 改变参数 T.

如果您需要更深入的理解：您可以按照与深度为 1 的树相同的方式学习树桩。要在加权数据集上学习树，您需要选择特征和值，根据所选特征以最佳方式将数据集分成两部分到加权指标，例如 Entropy and Information Gain。您可以使用 for 循环遍历所有可用特征，在嵌套循环中对选择的特征进行排序，并根据所选特征和分隔符值尝试将数据集所有可能的分离分成两组 S，然后计算每个集合的熵，因为它写在维基百科上, 而不是将 p(x) 计算为