RandomForestClassifier 如何用于分类?

How does RandomForestClassifier work for classification?

我了解到 Sklearn 将多 class class 化问题视为二进制问题的集合。引用 Sklearn 用户指南:

In extending a binary metric to multiclass or multilabel problems, the data is treated as a collection of binary problems, one for each class.

因此,二元 class 化模型,如 LogisticRegression 或支持向量矩阵可以通过使用一对一或一对多策略来支持多 class 案例.我想知道 RandomForestClassifier 是否也是这种情况? Sklearn 中的其他 class 化器怎么样 - 在处理多 class 问题时,它们是否都在幕后用作二进制 class 化器?

根据 Decision Trees 的文档,多输出问题会在随机森林中对每棵树的叶子添加一个小的变化。

假设您设置了criterion='gini'。本质上,每个节点都是通过选择 max_features 个特征的子集,计算所有 N classes 的基尼杂质的平均减少量并选择减少它最多的可变阈值组合来构建的。

这意味着随机森林不会为每个 class 创建一个模型。相反,它只是一个模型,它同时减少每棵树的每个节点中所有 class 的标准度量,并预测每个叶子上最常见的 class。